inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

CUDA 프로그래밍 (6) - C/C++/GPU 병렬 컴퓨팅 - 서치 & 소트

39g-merge-global-large.cu에 대해서 질문드립니다.

해결된 질문

379

박 신석

작성한 질문수 5

0

안녕하세요.

예저코드 39g-merge-global-large.cu를 보던 중에 궁금증이 생겨 질문 드립니다.

제가 궁금한 부분은 deviceMergeSort함수 마지막 부분에 아래의 2줄입니다.

cudaMemcpy( vecC, dev_vecC, TOTAL_NUM * sizeof(unsigned), cudaMemcpyDeviceToHost );
cudaMemcpy( dev_vecB, dev_vecC, TOTAL_NUM * sizeof(unsigned), cudaMemcpyDeviceToDevice );

dev_vecC에 들어 있는 정렬된 데이터를 왜 for문 내부에서 dev_vecB와 vecC로 계속 memcpy하는 걸까요?
제 생각에는 dev_vecB는 주소값을 스왑하여 사용하면 될거 같았고, vecC도 계산 모두 마무리되어 for문밖에서 복사해줘도 될거 같다고 생각이 들어서요.

 

c c++ cuda gpu

답변 1

1

드립커피+한모금더

안녕하세요.

CUDA 프로그래밍 강의를 수강해 주셔서 감사합니다.

질문하셨던 부분을 확인해 보니, 말씀 하신 내용이 맞습니다.

for 루프 안 쪽에 있을 필요가 없는 부분인데, 이전 코드를 확장하는 과정에서, 그대로 copy 했던 것 같습니다.

말씀하신 부분을 수정해서, 다시 올리도록 하겠습니다.

감사합니다.

코딩살구클럽 가입 요청드립니다.

0

2

1

6강 5:15

0

10

1

5강 5:45

0

8

2

전체적으로 답을 먼저 알려주지 마세요..

0

12

2

코딩살구클럽 채점 안됨

0

10

2

4-O 채점 관련 질문

0

15

2

코딩살구클럽가입

0

17

1

코딩살구클럽 가입

0

34

2

업캐스팅 문제 예시 5

0

34

2

(기출) 2025년 2회 이론 파트

0

32

2

26년 1회실기

0

41

2

비쥬얼 스튜디오로 해도 되나요?

0

51

2

강의 자료

0

38

2

scanf_s 에 관해서 오류나옵니다.

0

52

3

27:15 break 출력

0

38

2

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항

0

26

1

자문자답- 맞는지 틀린지 확인부탁드립니다.

0

33

1

55강 파이썬에만있는 연산자들

0

39

2

55강의 파이썬에서만 있는 연산자들

0

30

2

[문의] 강의 코드 제공여부

0

37

2

코딩살구클럽 가입 문의

0

70

2

코딩 살구 클럽 컴파일 에러

0

49

3

예제를 돌려보고 싶은데 common.cpp은 어디에 있을까요?

0

363

1

예제 코드에 대해서 질문 드립니다.

0

415

1