CUDA 프로그래밍 (5) - C/C++/GPU 병렬 컴퓨팅 - 아토믹 연산 atomic op

✅ 전체 (1) ~ (6)의 시리즈 중, (5) 아토믹 연산(atomic op)으로 최적화 ✅ NVIDIA GPU + CUDA 프로그래밍을 기초부터 차근차근 설명합니다. ✅ C++/C 언어로 배열/행렬/이미지처리/통계처리/정렬 등을 병렬 컴퓨팅으로 매우 빠르게 처리합니다.

(5.0) 수강평 8개

수강생 179명

난이도 중급이상

수강기한 36개월

드립커피+한모금더

gpu

커널

nvidia

gpu

커널

nvidia

질문

고민있어요

스터디

다른 수강생들이 자주 물어보는 질문이 궁금하신가요?

미해결
[30-4] hist-shared.cu 에서 질문있습니다.
"hist-shared.cu"의 다음 부분에서 질문있습니다.<code class="langu
c
c++
cuda
gpu
병렬-처리
정재헌
・
2024. 08. 23.
0
149
2
해결
선생님 gpu->cpu 속도 개선에 대해서 질문드려요
선생님 안녕하세요. 저번에 opencl과 cuda를 같이 공부 중이던 학생이에요.제가 프로그램을 작성하는 도중에 VRAM RAM의 전송 속도가 느리다는 것을 깨달았는데요.<img src="https://cdn.infl
c
c++
cuda
gpu
병렬-처리
igbtkd
・
2023. 06. 08.
0
611
1
해결
32-2의 warp의 early terminate에 대해 질문드립니다.
안녕하세요!정말 재미있게 강의를 보고 있습니다.그런데 강의 32-2를 보다 궁금증이 생겨 질문 드립니다!warp의 early terminate가 정확히 어떤 동작인지 궁금한데요. 제가 생각해 볼 때 __syncthre
c
c++
cuda
gpu
병렬-처리
박 신석
・
2023. 03. 12.
0
366
1
해결
28-4 shuffle shared - shared memory 강의에서 질문이 있습니다.
안녕하세요. 강의 정말 너무 잘 보고 있습니다!! 다름이 아니라 28-4 강의를 보다 궁금하게 있어서 질문을 드립니다.even odd방식이 Half and Half 알고리즘보다 느린 이유Globa
c
c++
cuda
gpu
병렬-처리
박 신석
・
2023. 03. 06.
0
425
1