CUDAプログラミング (3) - C/C++/GPU並列コンピューティング - メモリ構造
✅ 全 (1) ~ (6) のシリーズのうち、(3) CUDA メモリ階層構造の最適化 ✅ NVIDIA GPU + CUDA プログラミングを基礎から一歩ずつ解説します。 ✅ C++/C 言語で配列/行列/画像処理/統計処理/ソートなどを並列コンピューティングで非常に高速に処理します。
他の受講生がよくする質問が気になりますか?
- 未解決
pitch값에 따른 alignement boundary(size) 질문
안녕하세요, 선생님의 좋은 강의 덕분에 잘 공부하고 있습니다.강의 내용 복기 중에 한가지 의문이 생겨 질문 남깁니다.강의 17-8 matrix addition, pitched의 4분 07초 부분에서 devic
cc++cudagpu병렬-처리bigkitekim
・
0
168
2
- 解決
[Matrix Addition Problem] 1D를 사용하지 않는 이유가 뭔가요?
강의에서 10,000 x 10,000 행렬의 덧셈을 해결하고자 했고, 이를 2D thread block(32 x 32)으로 풀어내셨습니다. 1D thread block을 사용하지 않는 것에 대한 의문
cc++cudagpu병렬-처리tizm4233217
・
0
208
1
- 解決
계산시간 비교
알찬 강의 계속 잘 듣고 있습니다!CPU와 GPU version의 계산시간 비교에 대해 질문 드립니다. 커널에서 계산시간만 비교하면 CUDA이 훨씬 빠릅니다. CPU version (filter-host.cu): 44,784
cc++cudagpu병렬-처리parkdongchan9384
・
1
363
2
- 解決
video에 필터를 적용하는 경우
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리superdy5569
・
0
360
1

