inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실전 인공지능으로 이어지는 딥러닝 개념 잡기

순환 신경망(Recurrent Neural Networks)

RNN 가중치 w,u,l shape 질문

378

엽강통강

작성한 질문수 19

1

안녕하세요 선생님 RNN에 대한 알고리즘을 공부하다가 가중치의 shape를 보면서 이해가 가지 않아서 질문을 드립니다

 

a(t)안에 있는 원소들의 shape들이 달라도 weight를 통해서 n*1의 형태로 만드는 것은 이해를 했는데

 

input과 ,h(t-1)의 행이 다른 이유는 무엇인가요?

행이 달라도 되는 이유가

I work at Google라고 할때

I, work (t시점이 work일때)

i, work의 글자 수의 차이 때문에 이렇게 행이 다른건가요?

 

감사합니다

머신러닝 딥러닝 인공신경망

답변 1

1

딥러닝호형

안녕하세요.

 

말씀하신 부분은 이해하신게 맞습니다 :) 관계식에 의해서 Ux가 크기 n x 1이고 Wh의 크기가 n x 1이므로 b+Wh+Ux 계산이 가능하여 a도 n x 1이 나오게 됩니다. 물론 여기서 b도 n x 1입니다.

행(?)이 달라도 되는 이유를 질문 주셨는데 h(t)의 길이를 의미하는 것인가요? h의 길이는 목적에 따라 다르며 h의 길이에 상관없이 many to one이나 one to many와 같이 아웃풋 길이를 정하실 수 있습니다. 그리고 임배딩할 때 글자 수와 관계없이 각 단어마다 하나의 벡터로 임배딩 됩니다.

예) I -> (1,0,0,0,....,0), work -> (0,0,1,0,....,0), .....

 

감사합니다!!

0

엽강통강

안녕하세요 선생님 추가적인 질문이 있습니다 선생님 강의하신 lstm 모형에서 unit = 64라고 하면 선생님이 보여주는 lstm 모형이 64개가 있다고 생각해야 하는건가요??? (lstm모형들이 64개가 붙어 있는건가요?)

 

감사합니다

1

딥러닝호형

LSTM 강의의 3:12분쯤 나오는 파란 네모 박스가 64개가 됩니다! RNN, LSTM, GRU는 내부 계산이 다를뿐이지 큰 구조는 모두 동일합니다.

뒤로가기 버튼 같은 것이 있나요?

0

5

0

강의 연장 문의

0

10

1

프로그램 실행시간에 대한 질문

1

13

2

비중 및 매수 종목수 조정.

1

13

2

Claude api가 소식 동기화가 늦는 문제

1

19

2

[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요

0

10

1

출력값 질문

0

19

2

슬롯 관련 문의

1

17

2

수업노트가 어디에 있나요?

0

26

1

[긴급요청] 28강 동영상 전체에 오디오가 잘못들어가있습니다.

0

25

1

실제 계좌 잔고 및 테스트중에

1

55

4

설치 및 설정 가이드 노션 자료는 없나요 ?

0

22

2

실기시험 제출관련

0

157

2

6.20 작업형 2 과적합

0

161

3

다중레이어 경사하강법에서 질문

0

279

2

XOR파트에서 입력표현 방식

1

300

2

경사하강법에서 다중레이어에서의 가중치를 구할 때 식이 이해가 가질 않습니다 ㅠ.ㅠ

1

377

1

경우에 따른 최적의 활성화 함수 선정하는 방법

0

450

2

전이학습 강의 중 질문이 있어서 남깁니다.

0

282

1

XOR 파트에서 질문 있습니다.

0

278

1

SGD + 모멘텀 등의 코드

0

482

1

bias가 왜 필요한지 정확하게 모르겠습니다.

2

1190

1

LSTM 모형의 이해

1

620

1

과적합 판단 방법에 대해 질문 드립니다.

0

2346

1