Lập trình CUDA (2) - Tính toán song song C/C++/GPU - Phép cộng vectơ
✅ Trong loạt bài (1) đến (6), (2) song song cộng các vectơ (mảng 1D) ✅ Lập trình GPU NVIDIA + CUDA được giải thích từng bước từ những điều cơ bản. ✅ Xử lý mảng/ma trận/hình ảnh/xử lý thống kê/sắp xếp,… được xử lý rất nhanh thông qua tính toán song song bằng ngôn ngữ C++/C.
211 học viên
Độ khó Trung cấp trở lên
Thời gian 36 tháng
Muốn biết những câu hỏi thường được học viên khác hỏi không?
- Đã giải quyết
ch .12 grid 설정 관련 질문 드립니다.
ch. 12에서 약 만 개의 데이터를 처리(add)하는 예제를 설명해주셨습니다.이때, core 1개만 사용 시 오류가 발생한다고 말씀하셨습니다. 이는 'SM이 1
cc++cudagpu병렬-처리mbislab20147966
・
2 tháng trước
0
50
2
- Đã giải quyết
memcpy 시간 고려 시 gpu vs. cpu
안녕하세요.올려주신 강의 잘 듣고 있습니다.memcpy 시간까지 고려하면 cpu로 연산한 것이 더 빠른
cc++cudagpu병렬-처리yji112
・
7 tháng trước
0
65
2
- Đã giải quyết
common.cpp의 procArg 함수에 대해 질문이 있습니다.
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리applyesoclab0289
・
0
120
2
- Đã giải quyết
Thread Block 개수에 제한이 있나요?
안녕하세요 저번 Vector Addition 수업에서는 256M(256 x 1024 x 1024)개의 연산을 수행하기 위해서>>로 커널을 런치하여 Bl
cc++cudagpu병렬-처리lidar
・
0
381
1
- Đã giải quyết
Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.
안녕하세요. 먼저 좋은 CUDA 강의를 제공해주셔서 감사합니다. 다름이 아니라 15-4 강의에서 Warp를 동시에 돌린다는 말에 질문이 있습니다. Warp 스케줄링을 저는 아래와 같이 비교하여 이
cc++cudagpu병렬-처리lidar
・
0
296
1
- Đã giải quyết
매크로 함수를 쓴 이유
안녕하세요!좋은 강의 잘 듣고 있습니다.common.cpp 코드 중에서 ELAPSED_TIME_BEGIN(N)과 ELAPSED_TIME_BEGIN(N)을 매크로 함수로 정의한 이유가 무었인지요?CUDA_CHECK_ERROR() 함수
cc++cudagpu병렬-처리parkdongchan9384
・
0
294
1
- Đã giải quyết
VS2022 컴파일 에러
예제소스코드12a-vecadd-host.cpp -> vecadd-host.cpp 로 파일명 고치고 common.cpp 랑 2개를 쿠다 프로젝트에 추가해서 컴파일 했는데 링크에러가 납니다.vecadd-host.obj : error L
cc++cudagpu병렬-처리kissureng4871
・
0
349
2
- Đã giải quyết
global 변수가 cuda memory에서 사용되는 이유
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리superdy5569
・
0
355
1
- Đã giải quyết
Warp 갯수에 대한 고찰입니다....
SM내 warp가 24개가 이상일 경우에 overlab이 생기지 않아 효율적인 스케줄링이 가능하다는 것은 정확히 이해 했지만, Warp 갯수가 적어지면 근본적으로 작업시간 자체는 줄지 않을까? 그렇다면 빨리 끝나는게 스케줄링이 좋은거 아닐까? 라는 생각이 들었습
cc++cudagpu병렬-처리rkdghrk124047
・
0
528
2
- Đã giải quyết
15강 Block ID 예제 오류 질문입니다.
안녕하세요?Jetson TX2 및 Xavier를 사용하여 CUDA예제를 실행하고 있습니다.Block 예제에서 tx2와 xavier의 결과가 달라서 질문드립니다.dimgrid>>에
cc++cudagpu병렬-처리rkdghrk124047
・
0
353
1
- Đã giải quyết
컴파일 시의 <typeinfo> 관련 에러
이 강의가 아니라, 다른 강의에서 나온 질문인데, 정보 공유 차원에서 올립니다. 실습 코드를 클라우드 환경에서 돌리고 있고, gcc version 7.5 를 쓰고 있습니다.<p style="
gpu병렬-처리C++cudaconemoresipofcoffee
・
0
575
1

