inflearn logo
강의

講義

知識共有

三角形の本番! OpenAI Triton初級

코드가 실행되는 순서에 관하여

解決済みの質問

377

tritonman

投稿した質問数 4

0

@triton.jit
def add_kernel(x_ptr, y_ptr, z_ptr, size, block_size: tl.constexpr):
    (...)

def add(x, y):
    z = (...)
    size = (...)

    def grid(meta):
        return (triton.cdiv(size, meta["block_size"]),)

    add_kernel[grid](x, y, z, size, 1024)

    return z

 

안녕하세요 vector_add.py를 보던 중, 코드 라인이 실행되는 순서가 궁금하여 질문남깁니다

 

수업에서 runtime 때 meta가 받아진다고 말씀해주셨는데요.

그렇다면 코드가 실행되는 순서가

  1. runtime 동안 add_kernel의 argument로 들어온 x, y, z, size, 1024가 meta로 받아지고

  2. meta를 이용해 grid가 (n, )의 형태로 set되고

  3. 그 이후 add_kernel이 실행된다

가 맞을까요?

 

또 하나 궁금한 것은 아래 라인이 실행될 때 @triton.jit 데코레이터의 역할인데요

add_kernel[grid](x, y, z, size, 1024)
  1. (x, y, z, size, 1024)를 meta로 받아준다

  2. 그 meta가 적용된 특정 grid 설정 위에서 add_kernel 함수가 실행될 수 있게 해준다

일까요?

 

파이썬에서 원래 함수는 subscriptable하지 않아, 위 syntax가 생소해서 질문드립니다

python 딥러닝 cnn gpgpu dropout openai argmax relu triton kernel-programming

回答 1

1

triangle

안녕하세요?

 

네 맞습니다! 알고 계신 순서로 실행이 됩니다. 그리고 triton.jit 데코레이터의 역할은 해당 함수를 Triton 커널로 정의하는 것입니다. triton.jit 데코레이터를 명시한 함수는 실행전에 컴파일 과정을 거치게 됩니다.

 

감사합니다.

기출 11회 작업형 2_전체 데이터 학습 여부

0

11

1

RateLimitError

0

7

2

예측값 결과 소수점 차이

0

16

2

여태까지 발견한 이슈들 공유드립니다.

1

15

1

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

13

0

전처리 train() test([ ])

0

14

2

작업형 1 배경지식 질문

0

17

2

옳게 풀은건지 질문드립니다!

0

13

1

roc_auc_score

0

22

2

재귀함수 연산법

0

11

2

추가질문 합니다

0

13

2

시험환경 구름

0

16

2

2유형 질문드려요

0

13

2

RandomForest vs lgb

0

22

2

전처리 관련질문

0

21

3

autotune은 아직 안 올라온 건가요?

0

62

1

강의만 봐서는 triton 커널이 pytorch에 비해 빨라 보이지 않네요..

0

203

2

block ptr 질문

0

80

2

디스코드 커뮤

0

107

1

앞으로의 강의 계획에 대하여

0

250

2

실행을 위한 최적 환경

1

840

1

강의 계획에 대하여

0

345

1

행렬곱 오차 문제

1

424

2

실습 코드

0

384

1