BEST

CUDA 프로그래밍 (2) - C/C++/GPU 병렬 컴퓨팅 - 벡터 vector 더하기

✅ 전체 (1) ~ (6)의 시리즈 중, (2) 벡터(1D 배열) 병렬로 동시에 더하기 ✅ NVIDIA GPU + CUDA 프로그래밍을 기초부터 차근차근 설명합니다. ✅ C++/C 언어로 배열/행렬/이미지처리/통계처리/정렬 등을 병렬 컴퓨팅으로 매우 빠르게 처리합니다.

(4.9) 수강평 13개

수강생 220명

난이도 중급이상

수강기한 36개월

드립커피+한모금더

gpu

커널

nvidia

gpu

커널

nvidia

질문

고민있어요

스터디

다른 수강생들이 자주 물어보는 질문이 궁금하신가요?

해결
ch .12 grid 설정 관련 질문 드립니다.
ch. 12에서 약 만 개의 데이터를 처리(add)하는 예제를 설명해주셨습니다.이때, core 1개만 사용 시 오류가 발생한다고 말씀하셨습니다. 이는 'SM이 1
c
c++
cuda
gpu
병렬-처리
mbi
・
4달 전
0
70
2
해결
memcpy 시간 고려 시 gpu vs. cpu
안녕하세요.올려주신 강의 잘 듣고 있습니다.memcpy 시간까지 고려하면 cpu로 연산한 것이 더 빠른
c
c++
cuda
gpu
병렬-처리
yji112
・
9달 전
0
81
2
해결
common.cpp의 procArg 함수에 대해 질문이 있습니다.
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
c
c++
cuda
gpu
병렬-처리
SoC E
・
2024. 10. 10.
0
133
2
해결
Thread Block 개수에 제한이 있나요?
안녕하세요 저번 Vector Addition 수업에서는 256M(256 x 1024 x 1024)개의 연산을 수행하기 위해서>>로 커널을 런치하여 Bl
c
c++
cuda
gpu
병렬-처리
OpenJR
・
2024. 04. 18.
0
399
1
해결
Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.
안녕하세요. 먼저 좋은 CUDA 강의를 제공해주셔서 감사합니다. 다름이 아니라 15-4 강의에서 Warp를 동시에 돌린다는 말에 질문이 있습니다. Warp 스케줄링을 저는 아래와 같이 비교하여 이
c
c++
cuda
gpu
병렬-처리
OpenJR
・
2024. 04. 18.
0
312
1
해결
매크로 함수를 쓴 이유
안녕하세요!좋은 강의 잘 듣고 있습니다.common.cpp 코드 중에서 ELAPSED_TIME_BEGIN(N)과 ELAPSED_TIME_BEGIN(N)을 매크로 함수로 정의한 이유가 무었인지요?CUDA_CHECK_ERROR() 함수
c
c++
cuda
gpu
병렬-처리
Dong Chan Park
・
2024. 02. 22.
0
301
1
해결
VS2022 컴파일 에러
예제소스코드12a-vecadd-host.cpp -> vecadd-host.cpp 로 파일명 고치고 common.cpp 랑 2개를 쿠다 프로젝트에 추가해서 컴파일 했는데 링크에러가 납니다.vecadd-host.obj : error L
c
c++
cuda
gpu
병렬-처리
하지
・
2023. 08. 28.
0
364
2
해결
global 변수가 cuda memory에서 사용되는 이유
- 출장이 잦아서, 답변에 시간이 좀 걸릴 수도 있습니다. 양해 바랍니다. - 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요.
c
c++
cuda
gpu
병렬-처리
superdy
・
2023. 07. 15.
0
369
1
해결
Warp 갯수에 대한 고찰입니다....
SM내 warp가 24개가 이상일 경우에 overlab이 생기지 않아 효율적인 스케줄링이 가능하다는 것은 정확히 이해 했지만, Warp 갯수가 적어지면 근본적으로 작업시간 자체는 줄지 않을까? 그렇다면 빨리 끝나는게 스케줄링이 좋은거 아닐까? 라는 생각이 들었습
c
c++
cuda
gpu
병렬-처리
rkdghrk12
・
2023. 04. 07.
0
540
2
해결
15강 Block ID 예제 오류 질문입니다.
안녕하세요?Jetson TX2 및 Xavier를 사용하여 CUDA예제를 실행하고 있습니다.Block 예제에서 tx2와 xavier의 결과가 달라서 질문드립니다.dimgrid>>에
c
c++
cuda
gpu
병렬-처리
rkdghrk12
・
2023. 03. 14.
0
359
1
해결
컴파일 시의 <typeinfo> 관련 에러
이 강의가 아니라, 다른 강의에서 나온 질문인데, 정보 공유 차원에서 올립니다. 실습 코드를 클라우드 환경에서 돌리고 있고, gcc version 7.5 를 쓰고 있습니다.<p style="
gpu
병렬-처리
C++
cuda
c
드립커피+한모금더
・
2022. 10. 11.
0
585
1