인프런 커뮤니티 질문&답변

헬로월드님의 프로필 이미지
헬로월드

작성한 질문수

TensorFlow 2.0으로 배우는 딥러닝 입문

머신러닝의 기본 프로세스 - 가설 정의, 손실함수 정의, 최적화 정의

안녕하세요 MSE 질문합니다.

작성

·

382

0

안녕하세요 '머신러닝의 기본 프로세스'를 공부하고 있습니다.

2분43초~ 5분30초에서

MSE가 오차의 제곱의 합을 개수로 나눈 것으로 알고 있는데(오차 제곱의 평균) 그런데 여기에 1/2을 곱한 이유는 무엇인가요?

답변 4

2

AISchool님의 프로필 이미지
AISchool
지식공유자

안녕하세요. 반갑습니다.

1/2을 곱한이유는 ^2로 제곱하는 부분이 Gradient Descent 과정에서 미분을 취하면 앞에 *2로 튀어나오기 때문에 이부분에 1/2을 곱해서 상쇄시킴으로써 수식을 더욱 깔끔하게 만들기 위함입니다.

1/2은 수식 전개를 깜끔하게 만들기 위한 상수이기때문에 1/2을 곱하든 곱하지 않든 최종 결과에 큰차이를 만들어내지는 않습니다.

더 자세한 내용은 아래 답변을 참조하세요.

https://datascience.stackexchange.com/questions/52157/why-do-we-have-to-divide-by-2-in-the-ml-squared-error-cost-function

감사합니다.

0

최종결과에는 어쨌든 영향은 가지만 이 부분은 러닝레이트로 상쇄가능하기에 그냥 편의상 없애는거아님?

0

저도 궁금한 부분이었는데 답변 감사합니다.

0

강의자료는 제공하지 않는가요 ?

헬로월드님의 프로필 이미지
헬로월드

작성한 질문수

질문하기