CUDA Programming (3) - C/C++/GPU Parallel Computing - Memory Structure
✅ (3) CUDA Memory Hierarchy Optimization, out of the full (1) to (6) series ✅ Explains NVIDIA GPU + CUDA programming step-by-step from the basics. ✅ Uses C++/C to process arrays, matrices, image processing, statistical processing, sorting, etc., extremely fast through parallel computing.
196 learners
Level Intermediate
Course period 36 months
Want to know what questions other learners frequently ask?
- Unresolved
pitch값에 따른 alignement boundary(size) 질문
안녕하세요, 선생님의 좋은 강의 덕분에 잘 공부하고 있습니다.강의 내용 복기 중에 한가지 의문이 생겨 질문 남깁니다.강의 17-8 matrix addition, pitched의 4분 07초 부분에서 devic
cc++cudagpu병렬-처리bigkitekim
・
0
168
2
- Resolved
[Matrix Addition Problem] 1D를 사용하지 않는 이유가 뭔가요?
강의에서 10,000 x 10,000 행렬의 덧셈을 해결하고자 했고, 이를 2D thread block(32 x 32)으로 풀어내셨습니다. 1D thread block을 사용하지 않는 것에 대한 의문
cc++cudagpu병렬-처리tizm4233217
・
0
208
1
- Resolved
계산시간 비교
알찬 강의 계속 잘 듣고 있습니다!CPU와 GPU version의 계산시간 비교에 대해 질문 드립니다. 커널에서 계산시간만 비교하면 CUDA이 훨씬 빠릅니다. CPU version (filter-host.cu): 44,784
cc++cudagpu병렬-처리parkdongchan9384
・
1
363
2
- Resolved
video에 필터를 적용하는 경우
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리superdy5569
・
0
360
1

