From the concept of the latest deep learning technology Vision Transformer to Pytorch implementation
patch 이미지 imshow 부분에 대해서 질문이 있습니다
368
44 asked
안녕하세요 "이미지 패치와 프로세스" 강의에서 10분여즈음에 patch data를 예시를 보여주셨는데
제가 실습한 이미지와는 달라서요.
32x32의 cifar10 이미지 데이터 중 하나를 8x8 이미지 패치 사이즈로 나눈 것인데 그러면 4x4개의 패치로 나와야 되는데 선생님께서 강의에서 예시로 보여드린 것과 조금 달라서요
감사합니다
Answer 2
1
안녕하세요.
예시 그림 만들 때 잘 보이게 하려고 이미지 사이즈 늘려서 패치를 더 여러 개로 나누었습니다!
숫자 바꿔가시면서 테스트 하시면 다양한 이미지를 보실 수 있을거예요 :)
mean attention distance
0
199
2
안녕하세요, vit에 관심이 많은 사람입니다.
1
233
1
positional embedding 학습이 잘 안되는 문제
1
365
1
행렬 차원 수 질문
0
315
1
Self Attention 질문 있습니다.
0
325
1
Multi-Head Attention 모델 구조에서 궁금한게 있습니다.
0
555
1
전처리 관련해서 질문이 있습니다
1
362
1
답변에 대한 추가질문이 있습니다.
1
301
1
헷갈리는게 몇개 있습니다ㅠㅠ
1
375
1
Positional Encoding, KQV 질문입니다!
2
623
1
강의 자료 슬라이드
0
738
2
비전 트랜스포머 - 최신 모델 강의에서 positional embedding
2
468
1
비전 트랜스포머 - 최신 모델' 강의에서 B*N*K 와 1*K*D 를 연산
1
401
1
'어텐션 기법 - 키, 쿼리, 밸류는 무엇인가?' 강의에서 (QK^T)
1
717
1
training
1
288
1
Image가 입력일 때 Cross Attention 결과가 궁금합니다.
0
889
1
Transformer의 input에 대해 질문드립니다.
1
415
1
ViT에 대한 전반적인 질문 드립니다!
1
394
1
Key query value관련 질문
1
567
2
Fine tuning 관련하여 질문 드립니다.
1
647
1
코드 질문
1
316
1
Dh의 의미
1
309
1
scheduler관련 질문드립니다.
2
276
1
E, Epos
0
304
1

