Transformer Decoder 강의에서 "MaskedMultihadAttention"클래스 질문
140
작성한 질문수 1
안녕하세요.
설명을 너무 잘해주셔서 Transformer에 대한 이해도가 높아졌습니다. 감사합니다.
강의 중 이해안되는 부분이 있어 질문드립니다.
"Char Level GPT 만들기"강의 중 MaskedMultiheadAttention 클래스 선언 부분의 attention 객체 만드는 부분의 매개변수가 이해가 안갑니다.
Class MaskedMultiheadAttention(nn.Module):
def init(self, embed_dim, num_heads):
...
self.attentions = nn.ModuleList([MaskedSelfAttention(attention_dim, attention_dim) for in range(num_heads)]
...
위에 attention 객체 생성할 때 입력단자로 attention_dim이 들어가게 되는데 embed_dim 이 들어가야 하는게 아닐까요?
선택사항이라고 하기에는 TrnsformerDecoderBlock 클래스 선언한 걸 보면 layer_norm1을 emed_dim으로 설정해서 그래도 맞지 않는 것 같아서요.
답변 부탁드릴게요!
답변 1
0
안녕하세요. 질문 감사합니다. 강의중 타입 오류가 있었던점 사과드립니다.
https://github.com/NoCodeProgram/deepLearning/blob/main/transformer/bibleGPT.ipynb
에 보시면, MaskedMultiheadAttention 선언부분이 있습니다.
class MaskedMultiheadAttention(nn.Module):
def __init__(self, embed_dim, num_heads):
super().__init__()
attention_dim = embed_dim // num_heads
self.attentions = nn.ModuleList([MaskedSelfAttention(embed_dim, attention_dim) for _ in range(num_heads)])
self.fc = nn.Linear(embed_dim, embed_dim)
강의 자료 열람 요청이 안되네요
0
14
1
예측에 사용하는 경제지표의 활용에 대해
1
27
2
강의 자료를 어디서 확인 할 수 있나요?
1
29
3
실습 코드
0
32
2
[참고] Cannot connect to host host.docker.internal:8080
0
44
2
40강 Multi GPU 필요성 설명이 두번 나오는 것 같아요
0
47
2
There are no longer any instances available with the requested specifications. Please refresh and try again.
0
76
2
MMDetection 버전 이슈
0
53
2
질문있는데요.. vLLM은 말씀하신 사양에 적용이되나요?
0
65
2
[업로드오류] 강의 내용과 제목 불일치
0
45
2
섹션22 퀴즈 질문
0
54
1
import torch가 안되는 경우는 어떻게 하나요?
0
54
1
소리가 겹쳐서 들려요
0
61
2
20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.
0
45
1
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?
0
59
1
수업자료
0
43
2
전 강의와 전혀 이어지지가 않음
0
63
1
pytorch local 설치 옵션에 conda 가 없습니다.
0
62
3
pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다
0
34
1
강의 환경설정 질문
0
63
2
모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?
0
52
2
오토인코더+ Knn, SVC 로 해석하는경우
0
67
3
모듈
0
93
1
state
0
93
2





