inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Từ khái niệm Vision Transformer công nghệ deep learning mới nhất đến triển khai Pytorch

patch 이미지 imshow 부분에 대해서 질문이 있습니다

368

ingbeeeded7104

44 câu hỏi đã được viết

0

안녕하세요 "이미지 패치와 프로세스" 강의에서 10분여즈음에 patch data를 예시를 보여주셨는데

제가 실습한 이미지와는 달라서요.

32x32의 cifar10 이미지 데이터 중 하나를 8x8 이미지 패치 사이즈로 나눈 것인데 그러면 4x4개의 패치로 나와야 되는데 선생님께서 강의에서 예시로 보여드린 것과 조금 달라서요

감사합니다

딥러닝 컴퓨터-비전 pytorch vision-transformer

Câu trả lời 2

1

dlbro

안녕하세요.

 

예시 그림 만들 때 잘 보이게 하려고 이미지 사이즈 늘려서 패치를 더 여러 개로 나누었습니다!

숫자 바꿔가시면서 테스트 하시면 다양한 이미지를 보실 수 있을거예요 :)

0

ingbeeeded7104

제공해주신 코드는 patch_size가 8인데, 실험하시기를 4로 하신 것 같네요

mean attention distance

0

199

2

안녕하세요, vit에 관심이 많은 사람입니다.

1

233

1

positional embedding 학습이 잘 안되는 문제

1

365

1

행렬 차원 수 질문

0

315

1

Self Attention 질문 있습니다.

0

325

1

Multi-Head Attention 모델 구조에서 궁금한게 있습니다.

0

555

1

전처리 관련해서 질문이 있습니다

1

362

1

답변에 대한 추가질문이 있습니다.

1

301

1

헷갈리는게 몇개 있습니다ㅠㅠ

1

375

1

Positional Encoding, KQV 질문입니다!

2

623

1

강의 자료 슬라이드

0

738

2

비전 트랜스포머 - 최신 모델 강의에서 positional embedding

2

468

1

비전 트랜스포머 - 최신 모델' 강의에서 B*N*K 와 1*K*D 를 연산

1

401

1

'어텐션 기법 - 키, 쿼리, 밸류는 무엇인가?' 강의에서 (QK^T)

1

717

1

training

1

288

1

Image가 입력일 때 Cross Attention 결과가 궁금합니다.

0

889

1

Transformer의 input에 대해 질문드립니다.

1

415

1

ViT에 대한 전반적인 질문 드립니다!

1

394

1

Key query value관련 질문

1

567

2

Fine tuning 관련하여 질문 드립니다.

1

647

1

코드 질문

1

316

1

Dh의 의미

1

309

1

scheduler관련 질문드립니다.

2

276

1

E, Epos

0

305

1