• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

회귀실습1 강의 관련 질문

21.07.14 19:57 작성 조회수 75

0

안녕하세요,

회귀실습 1 강의에서 Target만 히스토그램을 그리고 로그변환했는데, 피처값은 로그변환 하지 않는 별도의 이유가 있으신가요? 

강의 말미에 타겟값의 정규분포가 중요하다고 하셨는데, 피처들의 skewness는 스코어에 큰 영향을 주지 않는 것 인가요?

아니면 피처도 모두 EDA해보고 skewed 되어있으면 전부다 로그 변환하는게 좋은가요?

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

일반적으로 회귀에서 피처보다 target의 skew가 더 모델 성능에 민감합니다.

하지만 모델 성능에 중요한 영향을 끼치는 중요 피처가 skew 정도가 높다면 log 변환을 해주는게 좋습니다. 

해당 실습에서는 피처값에 대한 로그 변환은 별도로 생각하지 않았습니다.  중요 피처의 경우 스스로 로그 변환을 적용해보고 그 영향도를 직접 확인해 보시는 것도 좋을 것 같습니다. 

감사합니다.