最新のディープラーニング技術 Vision Transformerの概念からPytorchの実装まで

ビジョントランスフォーマー

Multi-Head Attention 모델 구조에서 궁금한게 있습니다.

解決済みの質問2023-07-27T07:11:04.706Z

566

knw4071421

投稿した質問数 63

안녕하세요. 코드 공부하면서 궁금한 점이 생겨 질문남깁니다.

앞선 이론 강의에서 이해한 바로는 MSA과정에서 Attention*value를 통해 [배치수, 헤드수, 패치수+1, Dh] 차원의 결과들이 나오고 Linear Projection을 통해 [배치수, 패치수+1, D] 차원의 결과가 얻어지는 것으로 이해했습니다.

attention = torch.softmax(q @ k / self.scale, dim=-1)
x = self.dropout(attention) @ v
x = x.permute(0,2,1,3).reshape(batch_size, -1, self.latent_vec_dim)

위와 같이 제공해주신 코드에는 이를 위한 Linear 과정이 따로 없는 것 같고 Attention*value 결과에 permute와 reshape를 해주었는데, 해당 과정이 이론에서 설명해주신 Linear 과정과 동일한 효과를 지니는 것일까요??

딥러닝 pytorch 컴퓨터-비전 vision-transformer

回答 1

dlbro

2023-07-27T08:32:53.523Z

안녕하세요.

y=Ax 형태가 linear 연산입니다. 즉, attention @ v가 linear 연산입니다!

감사합니다.

mean attention distance

2025-03-18T07:25:16.117Z

214

안녕하세요, vit에 관심이 많은 사람입니다.

2024-07-23T12:20:35.126Z

242

positional embedding 학습이 잘 안되는 문제

2024-04-18T23:13:24.933Z

373

행렬 차원 수 질문

2023-12-15T13:33:20.313Z

320

Self Attention 질문 있습니다.

2023-12-01T08:05:56.247Z

333

전처리 관련해서 질문이 있습니다

2023-07-25T10:28:04.936Z

365

답변에 대한 추가질문이 있습니다.

2023-07-11T10:30:03.540Z

307

헷갈리는게 몇개 있습니다ㅠㅠ

2023-07-05T16:07:48.200Z

385

Positional Encoding, KQV 질문입니다!

2023-06-16T18:32:40.332Z

628

강의 자료 슬라이드

2023-02-10T08:56:46.889Z

746

비전 트랜스포머 - 최신 모델 강의에서 positional embedding

2023-01-24T02:48:06.936Z

473

비전 트랜스포머 - 최신 모델' 강의에서 B*N*K 와 1*K*D 를 연산

2023-01-24T02:30:05.734Z

407

'어텐션 기법 - 키, 쿼리, 밸류는 무엇인가?' 강의에서 (QK^T)

2023-01-23T11:56:46.102Z

724

training

2022-11-12T04:20:42.143Z

293

Image가 입력일 때 Cross Attention 결과가 궁금합니다.

2022-09-21T23:34:39.847Z

897

Transformer의 input에 대해 질문드립니다.

2022-07-25T13:18:51.058Z

419

ViT에 대한 전반적인 질문 드립니다!

2022-05-11T16:12:15.788Z

401

Key query value관련 질문

2022-05-11T12:17:45.787Z

577

Fine tuning 관련하여 질문 드립니다.

2022-05-07T18:28:32.441Z

655

코드 질문

2022-05-06T06:46:31.211Z

322

Dh의 의미

2022-05-05T02:36:13.948Z

320

scheduler관련 질문드립니다.

2022-04-30T15:51:37.473Z

282

E, Epos

2022-04-04T16:10:58.740Z

316

key의 차원으로 정규화

2022-04-03T15:28:10.839Z

174