inflearn logo
강의

講義

知識共有

CUDAプログラミング (2) - C/C++/GPU並列コンピューティング - ベクトル vector 加算

15-7 lane id rules - レーンID付与ルールの説明

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항

解決済みの質問

5

sungho kang

投稿した質問数 17

0

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항을 보면

"알고 있을 필요 없음" $\rightarrow$ "모르면 AI 최적화 불가능"

그 이하는 system에서 처리" $\rightarrow$ "독립적 스레드 스케줄링 (ITS)"

"Thread Block 단위 (순서 없음)" $\rightarrow$ "Thread Block Cluster 계층의 등장"

AI 행렬 연산 시 이웃한 SM들끼리 메모리를 공유하며 고속으로 데이터를 주고받고 있는데 강의에 추가로 알려주시면 좋을 것 같아요 시간에 흐름에(구현 알고리즘) 따르 아키텍처도 많이 변경되고 있으니까요

c c++ cuda gpu 병렬-처리

回答 1

0

onemoresipofcoffee

안녕하세요.

말씀하신것 이외에도 CUDA 13.3이 나오면서 tiled computing 이 도입되었습니다.

해당 강의가 녹화되던 시점에는 나오지 않은 architecture 들이고, 새로운 내용을 준비하고 있습니다.

감사합니다.

자문자답- 맞는지 틀린지 확인부탁드립니다.

0

6

0

멍슨상이라 이름 변경하시는 게 어떠신지요?

1

12

0

55강 파이썬에만있는 연산자들

0

10

1

55강의 파이썬에서만 있는 연산자들

0

9

1

[문의] 강의 코드 제공여부

0

22

2

코딩살구클럽 가입 문의

0

35

2

코딩 살구 클럽 컴파일 에러

0

21

1

추천 문제

0

18

1

코딩살구클럽 승인

0

29

1

이 강의를 다 들으면 어떤 강의를 들어야 하나요?

0

33

2

선생님 13.3을 써도 큰 차이가 없나요?

0

32

2

코살구 1주차 1940번 문제 조건과 프라이빗 테스트 불일치 문의

0

34

2

메모리 동적할당시 메모리창 빨간 글씨

0

27

2

ch .12 grid 설정 관련 질문 드립니다.

0

87

2

memcpy 시간 고려 시 gpu vs. cpu

0

98

2

common.cpp의 procArg 함수에 대해 질문이 있습니다.

0

147

2

Thread Block 개수에 제한이 있나요?

0

424

1

Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.

0

324

1

매크로 함수를 쓴 이유

0

312

1

VS2022 컴파일 에러

0

383

2

global 변수가 cuda memory에서 사용되는 이유

0

378

1

Warp 갯수에 대한 고찰입니다....

0

553

2

15강 Block ID 예제 오류 질문입니다.

0

367

1

컴파일 시의 <typeinfo> 관련 에러

0

592

1