inflearn logo
강의

Course

Instructor

From the concept of the latest deep learning technology Vision Transformer to Pytorch implementation

patch 이미지 imshow 부분에 대해서 질문이 있습니다

368

ingbeeeded7104

44 asked

0

안녕하세요 "이미지 패치와 프로세스" 강의에서 10분여즈음에 patch data를 예시를 보여주셨는데

제가 실습한 이미지와는 달라서요.

32x32의 cifar10 이미지 데이터 중 하나를 8x8 이미지 패치 사이즈로 나눈 것인데 그러면 4x4개의 패치로 나와야 되는데 선생님께서 강의에서 예시로 보여드린 것과 조금 달라서요

감사합니다

딥러닝 컴퓨터-비전 pytorch vision-transformer

Answer 2

1

dlbro

안녕하세요.

 

예시 그림 만들 때 잘 보이게 하려고 이미지 사이즈 늘려서 패치를 더 여러 개로 나누었습니다!

숫자 바꿔가시면서 테스트 하시면 다양한 이미지를 보실 수 있을거예요 :)

0

ingbeeeded7104

제공해주신 코드는 patch_size가 8인데, 실험하시기를 4로 하신 것 같네요

mean attention distance

0

199

2

안녕하세요, vit에 관심이 많은 사람입니다.

1

233

1

positional embedding 학습이 잘 안되는 문제

1

365

1

행렬 차원 수 질문

0

315

1

Self Attention 질문 있습니다.

0

325

1

Multi-Head Attention 모델 구조에서 궁금한게 있습니다.

0

555

1

전처리 관련해서 질문이 있습니다

1

362

1

답변에 대한 추가질문이 있습니다.

1

301

1

헷갈리는게 몇개 있습니다ㅠㅠ

1

375

1

Positional Encoding, KQV 질문입니다!

2

623

1

강의 자료 슬라이드

0

738

2

비전 트랜스포머 - 최신 모델 강의에서 positional embedding

2

468

1

비전 트랜스포머 - 최신 모델' 강의에서 B*N*K 와 1*K*D 를 연산

1

401

1

'어텐션 기법 - 키, 쿼리, 밸류는 무엇인가?' 강의에서 (QK^T)

1

717

1

training

1

288

1

Image가 입력일 때 Cross Attention 결과가 궁금합니다.

0

889

1

Transformer의 input에 대해 질문드립니다.

1

415

1

ViT에 대한 전반적인 질문 드립니다!

1

394

1

Key query value관련 질문

1

567

2

Fine tuning 관련하여 질문 드립니다.

1

647

1

코드 질문

1

316

1

Dh의 의미

1

309

1

scheduler관련 질문드립니다.

2

276

1

E, Epos

0

304

1