최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항
최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항을 보면
"알고 있을 필요 없음" $\rightarrow$ "모르면 AI 최적화 불가능"
그 이하는 system에서 처리" $\rightarrow$ "독립적 스레드 스케줄링 (ITS)"
"Thread Block 단위 (순서 없음)" $\rightarrow$ "Thread Block Cluster 계층의 등장"
AI 행렬 연산 시 이웃한 SM들끼리 메모리를 공유하며 고속으로 데이터를 주고받고 있는데 강의에 추가로 알려주시면 좋을 것 같아요 시간에 흐름에(구현 알고리즘) 따르 아키텍처도 많이 변경되고 있으니까요
Câu trả lời 1
0
안녕하세요.
말씀하신것 이외에도 CUDA 13.3이 나오면서 tiled computing 이 도입되었습니다.
해당 강의가 녹화되던 시점에는 나오지 않은 architecture 들이고, 새로운 내용을 준비하고 있습니다.
감사합니다.
자문자답- 맞는지 틀린지 확인부탁드립니다.
0
6
0
멍슨상이라 이름 변경하시는 게 어떠신지요?
1
12
0
55강 파이썬에만있는 연산자들
0
10
1
55강의 파이썬에서만 있는 연산자들
0
9
1
[문의] 강의 코드 제공여부
0
22
2
코딩살구클럽 가입 문의
0
35
2
코딩 살구 클럽 컴파일 에러
0
21
1
추천 문제
0
18
1
코딩살구클럽 승인
0
29
1
이 강의를 다 들으면 어떤 강의를 들어야 하나요?
0
33
2
선생님 13.3을 써도 큰 차이가 없나요?
0
32
2
코살구 1주차 1940번 문제 조건과 프라이빗 테스트 불일치 문의
0
34
2
메모리 동적할당시 메모리창 빨간 글씨
0
27
2
ch .12 grid 설정 관련 질문 드립니다.
0
87
2
memcpy 시간 고려 시 gpu vs. cpu
0
98
2
common.cpp의 procArg 함수에 대해 질문이 있습니다.
0
147
2
Thread Block 개수에 제한이 있나요?
0
424
1
Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.
0
324
1
매크로 함수를 쓴 이유
0
312
1
VS2022 컴파일 에러
0
383
2
global 변수가 cuda memory에서 사용되는 이유
0
378
1
Warp 갯수에 대한 고찰입니다....
0
553
2
15강 Block ID 예제 오류 질문입니다.
0
367
1
컴파일 시의 <typeinfo> 관련 에러
0
592
1

