RNN 가중치 w,u,l shape 질문
372
작성한 질문수 19
안녕하세요 선생님 RNN에 대한 알고리즘을 공부하다가 가중치의 shape를 보면서 이해가 가지 않아서 질문을 드립니다
a(t)안에 있는 원소들의 shape들이 달라도 weight를 통해서 n*1의 형태로 만드는 것은 이해를 했는데
input과 ,h(t-1)의 행이 다른 이유는 무엇인가요?
행이 달라도 되는 이유가
I work at Google라고 할때
I, work (t시점이 work일때)
i, work의 글자 수의 차이 때문에 이렇게 행이 다른건가요?
감사합니다
답변 1
1
안녕하세요.
말씀하신 부분은 이해하신게 맞습니다 :) 관계식에 의해서 Ux가 크기 n x 1이고 Wh의 크기가 n x 1이므로 b+Wh+Ux 계산이 가능하여 a도 n x 1이 나오게 됩니다. 물론 여기서 b도 n x 1입니다.
행(?)이 달라도 되는 이유를 질문 주셨는데 h(t)의 길이를 의미하는 것인가요? h의 길이는 목적에 따라 다르며 h의 길이에 상관없이 many to one이나 one to many와 같이 아웃풋 길이를 정하실 수 있습니다. 그리고 임배딩할 때 글자 수와 관계없이 각 단어마다 하나의 벡터로 임배딩 됩니다.
예) I -> (1,0,0,0,....,0), work -> (0,0,1,0,....,0), .....
감사합니다!!
0
안녕하세요 선생님 추가적인 질문이 있습니다 선생님 강의하신 lstm 모형에서 unit = 64라고 하면 선생님이 보여주는 lstm 모형이 64개가 있다고 생각해야 하는건가요??? (lstm모형들이 64개가 붙어 있는건가요?)
감사합니다
평가결과값 문의
0
7
1
시계열 데이터 날짜와 시간 format
0
15
1
평가지표 F1 스코어 질문드립니다.
0
18
2
파트9 강의는 언제 오픈하시나요
0
25
2
작업형 2 기출7회분에서
0
32
2
ZIP 파일
0
23
2
26강 13F 강의 불일치 및 질문 요청
0
30
3
[업로드오류] 강의 내용과 제목 불일치
0
24
2
작업형2 모의문제1 (30강)
0
29
2
수강 기간 연장 문의 드립니다.
0
35
2
섹션22 퀴즈 질문
0
30
1
수강 계획과 관련해 문의 드립니다.
0
26
2
Breadth (등락 비율) 분석
0
23
1
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
49
2
다중레이어 경사하강법에서 질문
0
267
2
XOR파트에서 입력표현 방식
1
286
2
경사하강법에서 다중레이어에서의 가중치를 구할 때 식이 이해가 가질 않습니다 ㅠ.ㅠ
1
368
1
경우에 따른 최적의 활성화 함수 선정하는 방법
0
431
2
전이학습 강의 중 질문이 있어서 남깁니다.
0
275
1
XOR 파트에서 질문 있습니다.
0
270
1
SGD + 모멘텀 등의 코드
0
480
1
bias가 왜 필요한지 정확하게 모르겠습니다.
2
1169
1
LSTM 모형의 이해
1
617
1
과적합 판단 방법에 대해 질문 드립니다.
0
2325
1





