• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

텐서플로우의 GRU셀의 파라미터 개수에 대한 질문이 있습니다.

23.04.18 03:04 작성 조회수 311

0

강사님 언제나 양질의 강의에 감사드립니다. 강의 덕분에 1회독을 수월하게 끝낼 수 있었습니다.

다름이 아니라 텐서플로우의 GRU셀의 파라미터 개수에 대해 질문이 있습니다.

538p의 GRU 방식에서는 Wg 뉴런에서 Wh, Wx를 한번에 처리하여 절편이 해당 뉴런에 하나 배정되었던 것으로 이해했습니다. 이전에도 파라미터의 개수를 계산할 때 절편은 뉴런당 하나이므로...의 방식으로 제일 마지막에 절편 개수를 더해왔구요.

그런데 540p에서 Wh와 Wx를 계산하는 순서가 분리되어 개별적인 절편이 필요하다는 부분이 조금 이해가 되질 않습니다. 해당 부분을 '별도의 선형 방정식이 추가 된 것'이라고 설명 해주셨는데 추가적인 셀이 생성 된 것은 아니겠지요...?

여태 제가 이해한 것이 '뉴런 당 절편 하나' 이어서 그런지 '별도의 선형 방정식이 추가 된 것'이라는 설명이 직관적으로 이해되질 않습니다...

실제로 538p의 Wg셀은 그대로이고 내부적으로 방정식과 별도의 절편만 추가 된 것으로 이해하면 될지, 아니면 Wh라는 별도의 셀이 추가 된 것으로 이해하면 될 지 궁금합니다

답변 1

답변을 작성해보세요.

0

안녕하세요. 사실 셀 이란 개념이 명확하지 않습니다. 추가된 선형 방정식을 셀이라 불러도 좋겠지만 일반적으로 GRU에서는 세 개의 셀이 있다고 말하기 때문에 그렇게 하면 혼돈이 될 것 같네요. 내부적으로 GPU 계산의 효율성을 위해 방정식이 추가되었다고 이해하시는게 좋을 것 같습니다. 감사합니다.