Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.
안녕하세요. 먼저 좋은 CUDA 강의를 제공해주셔서 감사합니다.
다름이 아니라 15-4 강의에서 Warp를 동시에 돌린다는 말에 질문이 있습니다.
Warp 스케줄링을 저는 아래와 같이 비교하여 이해하였습니다.
CPU: Core -> 여러개의 쓰레드
GPU: SM -> 여러개의 Warp
강의 내용처럼, CUDA에서 Warp별로 스케줄링을 관리를 한다면 모든 SP의 Clock들이 같은 Instruction을 수행(SM내 SP들의 Clock들은 Sync가 맞음)하여야 Warp단위로 스케줄링이 가능할 것 같은데, 제 생각이 맞는지 궁금합니다.
감사합니다.
回答 1
0
안녕하세요.
네. 당연히 그렇게 처리 합니다.
SM 1개 내의 모든 SP 들은 같은 clock 으로 동시에 실행됩니다.
warp 단위로 실행 해야 하다 보니, 같은 warp 를 실행하는 32개의 SP 는 instruction 도 똑같은 것을 수행합니다.
강의에서도 한번 설명했지만, GPU 구조에서는 ALU + control unit 쪽을 줄이는 대신 갯수를 늘리는 쪽으로 설계 방향을 잡았는데, ALU 를 줄이는 데는 한계가 있고, 결국 control unit을 최대한 줄이는 방법이, 32개의 warp를 실행하는 32개의 SP가 control unit 1개의 통제를 받는 방식이고, 이러면, 이들은 동시에 똑같은 instruction을 수행하는 수 밖에 없습니다.
감사합니다.
Reticle이 안나옵니다.
0
7
1
진행 방법 질문드립니다!
0
26
2
Singleton 관련 질문입니다.
1
28
2
안녕하세요. 계속 프로젝트를 해야지 하다가 결제하고 환경 설정 중입니다.
0
14
1
Export template 안됨
1
26
2
2-I) 왜 이 문제가 그래프이론 카테고리에 있는지 잘 모르겠습니다.
0
54
2
AddGameFrameworkComponentReceiver vs AddExtensionHandler
0
24
0
scanf("%d\n") 의미
0
20
1
필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)
0
37
2
2주차 개념#12 트리 순회
0
25
2
백준 사이트 서비스 종료
0
111
3
26년 1회 실기 해설 강의
0
51
2
프로젝트 질문 문의
0
45
1
주소 연산자(&) 간접 지정자(*) 반대 개념
0
33
1
ch .12 grid 설정 관련 질문 드립니다.
0
72
2
memcpy 시간 고려 시 gpu vs. cpu
0
82
2
common.cpp의 procArg 함수에 대해 질문이 있습니다.
0
133
2
Thread Block 개수에 제한이 있나요?
0
399
1
매크로 함수를 쓴 이유
0
301
1
VS2022 컴파일 에러
0
365
2
global 변수가 cuda memory에서 사용되는 이유
0
369
1
Warp 갯수에 대한 고찰입니다....
0
540
2
15강 Block ID 예제 오류 질문입니다.
0
359
1
컴파일 시의 <typeinfo> 관련 에러
0
585
1

