hello-prrallel.cu 의 병렬처리에 관하여
좋은 강의 고맙습니다.
병렬처리라면 일반적으로 다른 쓰레드에 영향을 주지 않고 수행이 될거라 생각이 됩니다.
예제 코드에서
hello<<<1,8>>>();
을 이용하여 쓰레드 8개를 병렬로 돌리는데 출력된 값은
hello CUDA 0!
hello CUDA 1!
hello CUDA 2!
,,,
hello CUDA 7!
이 되는 것을 볼 수 있는데 병렬로 처리된다면 출력 되는 숫자가 순차적으로 나올 수 없는 것 아닌가요?
Answer 1
0
안녕하세요.
출장 관계로, 답장이 조금 늦었습니다.
출력된 예제는, 시스템에 따라서, 다르게 나올 수 있습니다.
8개의 쓰레드가 병렬로 실행될 것이고, 이론 상은 완벽히 병렬로 실행되면, 어떠한 순서로도 출력이 나올 수 있습니다. 즉, 0-1-2-3-4-5-6-7 로 실행 결과가 나오는 것도 가능합니다.
직렬로 실행하면, 어떠한 경우, 어떠한 시스템에서도 0-1-2-3-4-5-6-7 순서로만 출력이 되겠지만,
병렬로 실행되면, 시스템에 따라서, 프로그램에 따라서, 당시 실행 환경에 따라서, 어떠한 순서로 나와도 문제가 없다고 판정합니다.
다음에, 8개의 쓰레드가 모두 완벽히 똑같은 시간에 종료되었다고 해도, print 를 출력하는 부분은 결국 serial 처리를 하게 될 겁니다. OS 아래 부분에서 8개의 print 요구에 대해서, 이것들이 완벽히 동시에 도착했더라도, 이것들 끼리의 우선순위를 부여해서, 1개씩 차례로 처리해야 할 겁니다.
이 부분을 구현하는 입장에서는, 가장 쉬운 우선순위가, 쓰레드 ID 가 될 수도 있을 것이고, 들어오는 순서가 되기도 할 것이고, 다양한 선택이 가능할 겁니다.
시스템에 따라서, 특정 우선 순위를 선택하면, 정확히 동시에 처리가 끝나도, 우선 순위 때문에, 항상 0-1-2-3-4-5-6-7 순서로 나오게 할 수도 있을 겁니다.
정리하면, 완벽한 병렬처리가 되었다면, 8개 쓰레드의 출력 순서가 임의로 나올 수 있고,
그중에 0-1-2-3-4-5-6-7 가 나와도 전혀 이상하지 않습니다.
C/C++ 의 직렬 처리에서는 항상 0-1-2-3-4-5-6-7 순서로 나와야만 하지만,
병렬 처리 결과는 어떠한 순서로 나와도 문제가 없고, 8개 정도의 병렬 처리에서는 순서가 어긋나는 경우가 잘 발생하지 않을 겁니다.
나중에 백 만개 이상의 쓰레드를 실행하면, 여러가지 이유로 쓰레드 마다 소요 시간이 다 다르고, 그것도 매번 실행할 때마다 소요 시간이 다르게 나와서, 출력 순서가 매번 전혀 다르게 나올 수도 있기 때문에, 이것을 신경써서 코딩해야 하는 것이 병렬 처리의 중요한 점 중의 하나가 됩니다.
강의를 계속 진행해 나가면, 병렬 처리의 더 복잡한 결과들이 나오게 됩니다.
감사합니다.
Reticle이 안나옵니다.
0
7
1
진행 방법 질문드립니다!
0
26
2
Singleton 관련 질문입니다.
1
27
2
안녕하세요. 계속 프로젝트를 해야지 하다가 결제하고 환경 설정 중입니다.
0
14
1
Export template 안됨
1
26
2
2-I) 왜 이 문제가 그래프이론 카테고리에 있는지 잘 모르겠습니다.
0
54
2
AddGameFrameworkComponentReceiver vs AddExtensionHandler
0
24
0
scanf("%d\n") 의미
0
20
1
필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)
0
37
2
2주차 개념#12 트리 순회
0
25
2
백준 사이트 서비스 종료
0
111
3
26년 1회 실기 해설 강의
0
51
2
프로젝트 질문 문의
0
45
1
주소 연산자(&) 간접 지정자(*) 반대 개념
0
33
1
53번 4-1 자료 오류 있는 것 같습니다.
0
68
2
7번문제
0
57
2
C언어 변형문제 9번문제 Pdf 수정요청
0
45
2
cudaFree가 자동으로 되는 상황
0
79
2
MSB3721 오류
0
242
2
식별자 threadIdx 정의 되지 않음 오류
0
225
2
cudaGetLastError() 에러 처리
0
133
1
CUDA Samples 없음
0
183
2
gpu-add.cu 부분에서 커널 lanch 이후 cudaDeviceSynchronize() 부분 질문이요
0
491
1
에러처리 매크로에서!!
0
457
1

