인프런 커뮤니티 질문&답변
E, Epos
작성
·
301
0
입력값을 만들 때에 k x D차원의 E 행렬을 곱해주고, Epos를 더해주는데 이 행렬들의 초기값은 어떻게 되는 것인가요?
그리고 이 행렬들도 학습이 되는 변수인지 아니면 상수인지 궁금합니다.
퀴즈
트랜스포머가 기존 순환 모델(LSTM 등)과 다른 주요 처리 방식은 무엇일까요?
순차적으로 데이터를 처리합니다.
어텐션을 이용해 병렬 처리합니다.
CNN 레이어를 주로 사용합니다.
어텐션 메커니즘을 사용하지 않습니다.





