inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Hiểu các khái niệm deep learning dẫn đến trí tuệ nhân tạo thực tế

Mạng thần kinh tái phát

RNN 가중치 w,u,l shape 질문

371

shingeon944656

19 câu hỏi đã được viết

1

안녕하세요 선생님 RNN에 대한 알고리즘을 공부하다가 가중치의 shape를 보면서 이해가 가지 않아서 질문을 드립니다

 

a(t)안에 있는 원소들의 shape들이 달라도 weight를 통해서 n*1의 형태로 만드는 것은 이해를 했는데

 

input과 ,h(t-1)의 행이 다른 이유는 무엇인가요?

행이 달라도 되는 이유가

I work at Google라고 할때

I, work (t시점이 work일때)

i, work의 글자 수의 차이 때문에 이렇게 행이 다른건가요?

 

감사합니다

머신러닝 딥러닝 인공신경망

Câu trả lời 1

1

dlbro

안녕하세요.

 

말씀하신 부분은 이해하신게 맞습니다 :) 관계식에 의해서 Ux가 크기 n x 1이고 Wh의 크기가 n x 1이므로 b+Wh+Ux 계산이 가능하여 a도 n x 1이 나오게 됩니다. 물론 여기서 b도 n x 1입니다.

행(?)이 달라도 되는 이유를 질문 주셨는데 h(t)의 길이를 의미하는 것인가요? h의 길이는 목적에 따라 다르며 h의 길이에 상관없이 many to one이나 one to many와 같이 아웃풋 길이를 정하실 수 있습니다. 그리고 임배딩할 때 글자 수와 관계없이 각 단어마다 하나의 벡터로 임배딩 됩니다.

예) I -> (1,0,0,0,....,0), work -> (0,0,1,0,....,0), .....

 

감사합니다!!

0

shingeon944656

안녕하세요 선생님 추가적인 질문이 있습니다 선생님 강의하신 lstm 모형에서 unit = 64라고 하면 선생님이 보여주는 lstm 모형이 64개가 있다고 생각해야 하는건가요??? (lstm모형들이 64개가 붙어 있는건가요?)

 

감사합니다

1

dlbro

LSTM 강의의 3:12분쯤 나오는 파란 네모 박스가 64개가 됩니다! RNN, LSTM, GRU는 내부 계산이 다를뿐이지 큰 구조는 모두 동일합니다.

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

4

1

강사님 안녕하세요 ㅎdatabricks환경에 대한 설

0

6

1

6-6

0

17

1

작업형 1 유형 부분

0

16

2

import torch가 안되는 경우는 어떻게 하나요?

0

17

1

작업형 1 (삭제예정, 구 버전)

0

34

2

강의노트는 어디있나요?

0

21

1

수강기간 연장 문의드립니다.

0

26

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

25

3

수강기간 연장 문의드립니다.

0

28

1

인덱스 슬라이싱

0

28

2

소리가 겹쳐서 들려요

0

23

2

6-6 실습 문의

0

25

2

섹션5 노션링크 는 따로 없나요?

0

32

2

다중레이어 경사하강법에서 질문

0

264

2

XOR파트에서 입력표현 방식

1

286

2

경사하강법에서 다중레이어에서의 가중치를 구할 때 식이 이해가 가질 않습니다 ㅠ.ㅠ

1

366

1

경우에 따른 최적의 활성화 함수 선정하는 방법

0

431

2

전이학습 강의 중 질문이 있어서 남깁니다.

0

275

1

XOR 파트에서 질문 있습니다.

0

270

1

SGD + 모멘텀 등의 코드

0

479

1

bias가 왜 필요한지 정확하게 모르겠습니다.

2

1165

1

LSTM 모형의 이해

1

616

1

과적합 판단 방법에 대해 질문 드립니다.

0

2321

1