코드가 실행되는 순서에 관하여
@triton.jit
def add_kernel(x_ptr, y_ptr, z_ptr, size, block_size: tl.constexpr):
(...)
def add(x, y):
z = (...)
size = (...)
def grid(meta):
return (triton.cdiv(size, meta["block_size"]),)
add_kernel[grid](x, y, z, size, 1024)
return z
안녕하세요 vector_add.py를 보던 중, 코드 라인이 실행되는 순서가 궁금하여 질문남깁니다
수업에서 runtime 때 meta가 받아진다고 말씀해주셨는데요.
그렇다면 코드가 실행되는 순서가
runtime 동안 add_kernel의 argument로 들어온 x, y, z, size, 1024가 meta로 받아지고
meta를 이용해 grid가 (n, )의 형태로 set되고
그 이후 add_kernel이 실행된다
가 맞을까요?
또 하나 궁금한 것은 아래 라인이 실행될 때 @triton.jit 데코레이터의 역할인데요
add_kernel[grid](x, y, z, size, 1024)(x, y, z, size, 1024)를 meta로 받아준다
그 meta가 적용된 특정 grid 설정 위에서 add_kernel 함수가 실행될 수 있게 해준다
일까요?
파이썬에서 원래 함수는 subscriptable하지 않아, 위 syntax가 생소해서 질문드립니다
Answer 1
1
안녕하세요?
네 맞습니다! 알고 계신 순서로 실행이 됩니다. 그리고 triton.jit 데코레이터의 역할은 해당 함수를 Triton 커널로 정의하는 것입니다. triton.jit 데코레이터를 명시한 함수는 실행전에 컴파일 과정을 거치게 됩니다.
감사합니다.
수강기간즘연장해주세요
0
3
1
작업형3 기출
0
6
1
유형2에서 데이터분할 생략 가능여부
0
7
1
9회 기출 유형3 질문
0
7
1
lgb 기초편
0
5
1
수업자료 문의
0
7
1
괄호 사용
0
8
1
작업형 2 데이터 전처리 질문
0
9
0
11회 기출 유형 작업형1 문제 3-1
0
8
0
7회 3유형 2번문제 질문
0
7
1
예시문제 작업형2 (ver2023) 질문입니다
0
10
1
Data type에 따른 처리
0
6
1
Cursor 실행 문의
1
11
2
데이터 전처리 관련
0
13
2
시험에서 문제 불러오기
0
12
2
autotune은 아직 안 올라온 건가요?
0
62
1
강의만 봐서는 triton 커널이 pytorch에 비해 빨라 보이지 않네요..
0
203
2
block ptr 질문
0
80
2
디스코드 커뮤
0
107
1
앞으로의 강의 계획에 대하여
0
250
2
실행을 위한 최적 환경
1
840
1
강의 계획에 대하여
0
345
1
행렬곱 오차 문제
1
424
2
실습 코드
0
384
1

