CUDA Programming (2) - C/C++/GPU Parallel Computing - Vector Addition
✅ Among the series of (1) to (6), (2) Simultaneous addition of vectors (1D arrays) in parallel ✅ NVIDIA GPU + CUDA programming is explained step by step from the basics. ✅ It processes arrays/matrices/image processing/statistical processing/sorting, etc. very quickly with parallel computing in C++/C language.
211 learners
Level Intermediate
Course period 36 months
Want to know what questions other learners frequently ask?
- Resolved
ch .12 grid 설정 관련 질문 드립니다.
ch. 12에서 약 만 개의 데이터를 처리(add)하는 예제를 설명해주셨습니다.이때, core 1개만 사용 시 오류가 발생한다고 말씀하셨습니다. 이는 'SM이 1
cc++cudagpu병렬-처리mbislab20147966
・
2 months ago
0
50
2
- Resolved
memcpy 시간 고려 시 gpu vs. cpu
안녕하세요.올려주신 강의 잘 듣고 있습니다.memcpy 시간까지 고려하면 cpu로 연산한 것이 더 빠른
cc++cudagpu병렬-처리yji112
・
7 months ago
0
65
2
- Resolved
common.cpp의 procArg 함수에 대해 질문이 있습니다.
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리applyesoclab0289
・
0
120
2
- Resolved
Thread Block 개수에 제한이 있나요?
안녕하세요 저번 Vector Addition 수업에서는 256M(256 x 1024 x 1024)개의 연산을 수행하기 위해서>>로 커널을 런치하여 Bl
cc++cudagpu병렬-처리lidar
・
0
381
1
- Resolved
Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.
안녕하세요. 먼저 좋은 CUDA 강의를 제공해주셔서 감사합니다. 다름이 아니라 15-4 강의에서 Warp를 동시에 돌린다는 말에 질문이 있습니다. Warp 스케줄링을 저는 아래와 같이 비교하여 이
cc++cudagpu병렬-처리lidar
・
0
296
1
- Resolved
매크로 함수를 쓴 이유
안녕하세요!좋은 강의 잘 듣고 있습니다.common.cpp 코드 중에서 ELAPSED_TIME_BEGIN(N)과 ELAPSED_TIME_BEGIN(N)을 매크로 함수로 정의한 이유가 무었인지요?CUDA_CHECK_ERROR() 함수
cc++cudagpu병렬-처리parkdongchan9384
・
0
294
1
- Resolved
VS2022 컴파일 에러
예제소스코드12a-vecadd-host.cpp -> vecadd-host.cpp 로 파일명 고치고 common.cpp 랑 2개를 쿠다 프로젝트에 추가해서 컴파일 했는데 링크에러가 납니다.vecadd-host.obj : error L
cc++cudagpu병렬-처리kissureng4871
・
0
349
2
- Resolved
global 변수가 cuda memory에서 사용되는 이유
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
cc++cudagpu병렬-처리superdy5569
・
0
355
1
- Resolved
Warp 갯수에 대한 고찰입니다....
SM내 warp가 24개가 이상일 경우에 overlab이 생기지 않아 효율적인 스케줄링이 가능하다는 것은 정확히 이해 했지만, Warp 갯수가 적어지면 근본적으로 작업시간 자체는 줄지 않을까? 그렇다면 빨리 끝나는게 스케줄링이 좋은거 아닐까? 라는 생각이 들었습
cc++cudagpu병렬-처리rkdghrk124047
・
0
528
2
- Resolved
15강 Block ID 예제 오류 질문입니다.
안녕하세요?Jetson TX2 및 Xavier를 사용하여 CUDA예제를 실행하고 있습니다.Block 예제에서 tx2와 xavier의 결과가 달라서 질문드립니다.dimgrid>>에
cc++cudagpu병렬-처리rkdghrk124047
・
0
353
1
- Resolved
컴파일 시의 <typeinfo> 관련 에러
이 강의가 아니라, 다른 강의에서 나온 질문인데, 정보 공유 차원에서 올립니다. 실습 코드를 클라우드 환경에서 돌리고 있고, gcc version 7.5 를 쓰고 있습니다.<p style="
gpu병렬-처리C++cudaconemoresipofcoffee
・
0
575
1

