inflearn logo
강의

Course

Instructor

CUDA Programming (2) - C/C++/GPU Parallel Computing - Vector Addition

15-7 lane id rules - Description of lane ID assignment rules

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항

Resolved

8

sungho kang

17 asked

0

최신 엔비디아 CUDA 아키텍처에서의 결정적 변경 사항을 보면

"알고 있을 필요 없음" $\rightarrow$ "모르면 AI 최적화 불가능"

그 이하는 system에서 처리" $\rightarrow$ "독립적 스레드 스케줄링 (ITS)"

"Thread Block 단위 (순서 없음)" $\rightarrow$ "Thread Block Cluster 계층의 등장"

AI 행렬 연산 시 이웃한 SM들끼리 메모리를 공유하며 고속으로 데이터를 주고받고 있는데 강의에 추가로 알려주시면 좋을 것 같아요 시간에 흐름에(구현 알고리즘) 따르 아키텍처도 많이 변경되고 있으니까요

c c++ cuda gpu 병렬-처리

Answer 1

0

onemoresipofcoffee

안녕하세요.

말씀하신것 이외에도 CUDA 13.3이 나오면서 tiled computing 이 도입되었습니다.

해당 강의가 녹화되던 시점에는 나오지 않은 architecture 들이고, 새로운 내용을 준비하고 있습니다.

감사합니다.

자문자답- 맞는지 틀린지 확인부탁드립니다.

0

9

0

55강 파이썬에만있는 연산자들

0

10

1

55강의 파이썬에서만 있는 연산자들

0

9

1

[문의] 강의 코드 제공여부

0

23

2

코딩살구클럽 가입 문의

0

37

2

코딩 살구 클럽 컴파일 에러

0

21

1

추천 문제

0

21

1

코딩살구클럽 승인

0

29

1

이 강의를 다 들으면 어떤 강의를 들어야 하나요?

0

39

2

선생님 13.3을 써도 큰 차이가 없나요?

0

33

2

코살구 1주차 1940번 문제 조건과 프라이빗 테스트 불일치 문의

0

34

2

메모리 동적할당시 메모리창 빨간 글씨

0

27

2

문제를 고민하는 시간 관련

0

27

2

ch .12 grid 설정 관련 질문 드립니다.

0

87

2

memcpy 시간 고려 시 gpu vs. cpu

0

98

2

common.cpp의 procArg 함수에 대해 질문이 있습니다.

0

147

2

Thread Block 개수에 제한이 있나요?

0

424

1

Warp를 동시에 돌린다는 말이 이해가 가지 않습니다.

0

324

1

매크로 함수를 쓴 이유

0

312

1

VS2022 컴파일 에러

0

383

2

global 변수가 cuda memory에서 사용되는 이유

0

378

1

Warp 갯수에 대한 고찰입니다....

0

553

2

15강 Block ID 예제 오류 질문입니다.

0

367

1

컴파일 시의 <typeinfo> 관련 에러

0

592

1