• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 질문입니다

23.03.01 19:48 작성 조회수 262

0

해당 강의 11:25 에서

standardScaler()를 X_train과 X_test에 적용을 시키는데 결과값인 y_train에는 결국 SalePrice를 구하기위해서 standardScaler()를 적용시키지 않는다고 이해를 했습니다.

여기서 질문이, 그럼 standardScaler()는 주로 input 데이터들(ex - X_train과 X_test 등) 에만 적용을 시키고 결과값(y_train 등)에는 적용을 잘 안시키나요?

답변 1

답변을 작성해보세요.

0

안녕하세요. 답변도우미입니다.

standardScale 은 feature 들의 스케일이 너무 달라서, 특정 feature 의 영향이 과하게 또는 너무 적게 반영이 되는 케이스가 있어서, cost 값이 발산하는등 정상적인 학습이 어려울 경우에 보통 적용을 합니다. 그래서 입력(feature) 데이터에 대해서 일반적으로 많이 하고요.

최종적으로 예측해야 하는 결과값인 y_train 에 scaling을 하게 되면, 결과값이 결국 변경이 되는 것이라서, 결과값 예측이 아예 잘못될 수 있어서 결과값까지 scaling 하지는 않는 것이 일반적입니다. 또는 scaling 을 했더라도, 다시 이를 기존 결과값 scaling 으로 변환해야 결과값에 유사한 값을 얻을 수 있습니다.

감사합니다.