코드가 실행되는 순서에 관하여
@triton.jit
def add_kernel(x_ptr, y_ptr, z_ptr, size, block_size: tl.constexpr):
(...)
def add(x, y):
z = (...)
size = (...)
def grid(meta):
return (triton.cdiv(size, meta["block_size"]),)
add_kernel[grid](x, y, z, size, 1024)
return z
안녕하세요 vector_add.py를 보던 중, 코드 라인이 실행되는 순서가 궁금하여 질문남깁니다
수업에서 runtime 때 meta가 받아진다고 말씀해주셨는데요.
그렇다면 코드가 실행되는 순서가
runtime 동안 add_kernel의 argument로 들어온 x, y, z, size, 1024가 meta로 받아지고
meta를 이용해 grid가 (n, )의 형태로 set되고
그 이후 add_kernel이 실행된다
가 맞을까요?
또 하나 궁금한 것은 아래 라인이 실행될 때 @triton.jit 데코레이터의 역할인데요
add_kernel[grid](x, y, z, size, 1024)(x, y, z, size, 1024)를 meta로 받아준다
그 meta가 적용된 특정 grid 설정 위에서 add_kernel 함수가 실행될 수 있게 해준다
일까요?
파이썬에서 원래 함수는 subscriptable하지 않아, 위 syntax가 생소해서 질문드립니다
답변 1
1
안녕하세요?
네 맞습니다! 알고 계신 순서로 실행이 됩니다. 그리고 triton.jit 데코레이터의 역할은 해당 함수를 Triton 커널로 정의하는 것입니다. triton.jit 데코레이터를 명시한 함수는 실행전에 컴파일 과정을 거치게 됩니다.
감사합니다.
새로운 종목 후보군 추가시 확인해야할 사항들
0
3
1
LLM chain 연결할때
0
3
0
뉴스 검색에서 날짜 필터링
0
13
2
run.py시 42501 에러
1
18
3
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
12
2
기존 pro 요금제 구독 필요
1
12
2
24강 전체 파이프라인
0
10
0
claude는 반드시 api형식이어야 하나요?
1
14
2
강의 잘 봤습니다.
0
10
1
2유형 object 컬럼 인코딩 관련 질문
0
21
2
Colab 실행시
1
17
1
하이퍼파라미터 변수
0
20
2
알파밴티지 뉴스 기사
1
13
1
scorer.py 에 뉴스/재료 점수 부분이 없어요.
0
16
2
52강 이원분산분석
0
18
2
autotune은 아직 안 올라온 건가요?
0
59
1
강의만 봐서는 triton 커널이 pytorch에 비해 빨라 보이지 않네요..
0
196
2
block ptr 질문
0
77
2
디스코드 커뮤
0
103
1
앞으로의 강의 계획에 대하여
0
249
2
실행을 위한 최적 환경
1
837
1
강의 계획에 대하여
0
345
1
행렬곱 오차 문제
1
424
2
실습 코드
0
382
1





