작성한 질문수
딥러닝 이론 + PyTorch 실무 완전 정복
해결된 질문
작성
·
213
1
6-5 섹션에서 Loss를 W(3)로 미분한 결과( = tW(3))를 계산하는 수식에 관련해서 질문이 있습니다..!
위의 사진과 같이 계산을 해보았는데 결과가 tW(3)이 아닌 2tW(3)으로 나오게 되었습니다..
Jacobian 개념이 생소하여 제대로 계산을 하였는지 잘 모르겠어서.. 혹시 계산에서 잘못된 부분을 알려주실 수 있을까요...??
답변 1
안녕하세요!
제 풀이과정을 한번 참조해보시면 도움이 될 것 같습니다!
y hat을 weight W에 대해서 미분할때 matrix가 아니라 3차원의 텐서가 되어서 풀이 과정에서 실수가 있어 보입니다.
W(i,j)와 독립적인 y(l) 들이 있어서 0으로 바뀌는 항들이 있었군요!좋은 설명 감사합니다!
W(i,j)와 독립적인 y(l) 들이 있어서 0으로 바뀌는 항들이 있었군요!
좋은 설명 감사합니다!