inflearn logo
강의

Course

Instructor

Self-study machine learning + deep learning

텐서플로우의 GRU셀의 파라미터 개수에 대한 질문이 있습니다.

491

ddcruw9107

11 asked

0

강사님 언제나 양질의 강의에 감사드립니다. 강의 덕분에 1회독을 수월하게 끝낼 수 있었습니다.

다름이 아니라 텐서플로우의 GRU셀의 파라미터 개수에 대해 질문이 있습니다.

538p의 GRU 방식에서는 Wg 뉴런에서 Wh, Wx를 한번에 처리하여 절편이 해당 뉴런에 하나 배정되었던 것으로 이해했습니다. 이전에도 파라미터의 개수를 계산할 때 절편은 뉴런당 하나이므로...의 방식으로 제일 마지막에 절편 개수를 더해왔구요.

그런데 540p에서 Wh와 Wx를 계산하는 순서가 분리되어 개별적인 절편이 필요하다는 부분이 조금 이해가 되질 않습니다. 해당 부분을 '별도의 선형 방정식이 추가 된 것'이라고 설명 해주셨는데 추가적인 셀이 생성 된 것은 아니겠지요...?

여태 제가 이해한 것이 '뉴런 당 절편 하나' 이어서 그런지 '별도의 선형 방정식이 추가 된 것'이라는 설명이 직관적으로 이해되질 않습니다...

실제로 538p의 Wg셀은 그대로이고 내부적으로 방정식과 별도의 절편만 추가 된 것으로 이해하면 될지, 아니면 Wh라는 별도의 셀이 추가 된 것으로 이해하면 될 지 궁금합니다

머신러닝 딥러닝

Answer 1

0

haesunpark

안녕하세요. 사실 셀 이란 개념이 명확하지 않습니다. 추가된 선형 방정식을 셀이라 불러도 좋겠지만 일반적으로 GRU에서는 세 개의 셀이 있다고 말하기 때문에 그렇게 하면 혼돈이 될 것 같네요. 내부적으로 GPU 계산의 효율성을 위해 방정식이 추가되었다고 이해하시는게 좋을 것 같습니다. 감사합니다.

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

2

1

강사님 안녕하세요 ㅎdatabricks환경에 대한 설

0

6

1

6-6

0

16

1

작업형 1 유형 부분

0

14

1

훈련세트 샘플 질문

0

140

2

linear 통과 전 입력 처리

0

249

2

여기 빨간 동그라미 친부분

0

261

1

5강 데이터 전처리 부분에서 에러 질문입니다

0

418

1

295쪽 세번째 문단

0

316

1

292쪽 픽셀값 분석하기

0

352

1

182쪽 distances

0

384

1

03-2 160쪽 릿지 회귀

0

354

1

왜 k 근접 회귀는 전처리를 안하나요

0

442

1

다중회귀 모델의 데이터량 관련

0

467

1

순환 신경망의 순환층의 가중치에 대해 질문이 있습니다

0

299

1

은닉 상태에 대한 질문이 있습니다

0

340

1

합성곱 신경망 파트에 대해 질문이 있습니다.

0

286

1

트리 알고리즘에 대해 질문이 있습니다

0

318

1

경사 하강법의 에포크의 반복에 대해 질문이 있습니다

0

439

2

.score() 메소드에 대해 질문이 있습니다

0

442

2

K최근접 모델 이웃선정 기준

0

457

1

k-최근점 알고리즘 질문 입니다.

0

534

1

질문이 있습니다!

0

195

1

특성공학과 규제 강의 중 질문

0

303

1