inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

CUDA 프로그래밍 (6) - C/C++/GPU 병렬 컴퓨팅 - 서치 & 소트

39g-merge-global-large.cu에 대해서 질문드립니다.

해결된 질문

370

박 신석

작성한 질문수 5

0

안녕하세요.

예저코드 39g-merge-global-large.cu를 보던 중에 궁금증이 생겨 질문 드립니다.

제가 궁금한 부분은 deviceMergeSort함수 마지막 부분에 아래의 2줄입니다.

cudaMemcpy( vecC, dev_vecC, TOTAL_NUM * sizeof(unsigned), cudaMemcpyDeviceToHost );
cudaMemcpy( dev_vecB, dev_vecC, TOTAL_NUM * sizeof(unsigned), cudaMemcpyDeviceToDevice );

dev_vecC에 들어 있는 정렬된 데이터를 왜 for문 내부에서 dev_vecB와 vecC로 계속 memcpy하는 걸까요?
제 생각에는 dev_vecB는 주소값을 스왑하여 사용하면 될거 같았고, vecC도 계산 모두 마무리되어 for문밖에서 복사해줘도 될거 같다고 생각이 들어서요.

 

c c++ cuda gpu

답변 1

1

드립커피+한모금더

안녕하세요.

CUDA 프로그래밍 강의를 수강해 주셔서 감사합니다.

질문하셨던 부분을 확인해 보니, 말씀 하신 내용이 맞습니다.

for 루프 안 쪽에 있을 필요가 없는 부분인데, 이전 코드를 확장하는 과정에서, 그대로 copy 했던 것 같습니다.

말씀하신 부분을 수정해서, 다시 올리도록 하겠습니다.

감사합니다.

5-B

0

27

2

질문있는데요.. vLLM은 말씀하신 사양에 적용이되나요?

0

30

2

20년 4,5회 13번

0

26

2

11강 CallOrRegister_OnExperienceLoaded 질문

0

32

1

4 - A

0

33

2

코딩살구클럽 입장이 안됩니다

0

84

2

강의자료는 어디서 받을 수 있죠?

1

36

2

4-F 경우의 수 질문입니다.

0

36

2

코딩살구클럽 가입이 안됩니다.

0

90

2

살구 클럽에 대한 질문있습ㄴ디ㅏ

0

65

1

교안 158페이지 문의드립니다

0

47

2

코딩살구클럽 관련 건의사항

0

124

1

코살에 19942 다이어트 문제에 N의 범위가 빠져있슴니다

0

46

1

Reticle이 안나옵니다.

0

28

2

진행 방법 질문드립니다!

0

87

2

Singleton 관련 질문입니다.

1

58

2

안녕하세요. 계속 프로젝트를 해야지 하다가 결제하고 환경 설정 중입니다.

0

22

1

Export template 안됨

1

45

2

2-I) 왜 이 문제가 그래프이론 카테고리에 있는지 잘 모르겠습니다.

0

65

2

AddGameFrameworkComponentReceiver vs AddExtensionHandler

0

35

1

scanf("%d\n") 의미

0

29

1

필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)

0

51

2

예제를 돌려보고 싶은데 common.cpp은 어디에 있을까요?

0

351

1

예제 코드에 대해서 질문 드립니다.

0

405

1