코드가 실행되는 순서에 관하여
@triton.jit
def add_kernel(x_ptr, y_ptr, z_ptr, size, block_size: tl.constexpr):
(...)
def add(x, y):
z = (...)
size = (...)
def grid(meta):
return (triton.cdiv(size, meta["block_size"]),)
add_kernel[grid](x, y, z, size, 1024)
return z
안녕하세요 vector_add.py를 보던 중, 코드 라인이 실행되는 순서가 궁금하여 질문남깁니다
수업에서 runtime 때 meta가 받아진다고 말씀해주셨는데요.
그렇다면 코드가 실행되는 순서가
runtime 동안 add_kernel의 argument로 들어온 x, y, z, size, 1024가 meta로 받아지고
meta를 이용해 grid가 (n, )의 형태로 set되고
그 이후 add_kernel이 실행된다
가 맞을까요?
또 하나 궁금한 것은 아래 라인이 실행될 때 @triton.jit 데코레이터의 역할인데요
add_kernel[grid](x, y, z, size, 1024)(x, y, z, size, 1024)를 meta로 받아준다
그 meta가 적용된 특정 grid 설정 위에서 add_kernel 함수가 실행될 수 있게 해준다
일까요?
파이썬에서 원래 함수는 subscriptable하지 않아, 위 syntax가 생소해서 질문드립니다
回答 1
1
안녕하세요?
네 맞습니다! 알고 계신 순서로 실행이 됩니다. 그리고 triton.jit 데코레이터의 역할은 해당 함수를 Triton 커널로 정의하는 것입니다. triton.jit 데코레이터를 명시한 함수는 실행전에 컴파일 과정을 거치게 됩니다.
감사합니다.
기출 11회 작업형 2_전체 데이터 학습 여부
0
11
1
RateLimitError
0
7
2
예측값 결과 소수점 차이
0
16
2
여태까지 발견한 이슈들 공유드립니다.
1
15
1
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
13
0
전처리 train() test([ ])
0
14
2
작업형 1 배경지식 질문
0
17
2
옳게 풀은건지 질문드립니다!
0
13
1
roc_auc_score
0
22
2
재귀함수 연산법
0
11
2
추가질문 합니다
0
13
2
시험환경 구름
0
16
2
2유형 질문드려요
0
13
2
RandomForest vs lgb
0
22
2
전처리 관련질문
0
21
3
autotune은 아직 안 올라온 건가요?
0
62
1
강의만 봐서는 triton 커널이 pytorch에 비해 빨라 보이지 않네요..
0
203
2
block ptr 질문
0
80
2
디스코드 커뮤
0
107
1
앞으로의 강의 계획에 대하여
0
250
2
실행을 위한 최적 환경
1
840
1
강의 계획에 대하여
0
345
1
행렬곱 오차 문제
1
424
2
실습 코드
0
384
1

