• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

선생님 질문있습니다.

21.11.16 03:15 작성 조회수 102

0

항상 좋은 강의 잘듣고 있습니다 :)

 

이상치 제거하고 검증용 세트로 모델 검증하는 과정에서 갑자기 궁금한게 생겨서 질문드립니다..!

이상치 제거한 모델을 실제 test 셋으로 평가 할때 행 수가 맞지 않잖아요..? 그럼 모델 평가가 안되는데

이경우에는 실제 test 세트에서도 인덱스를 제거하고 모델 평가를 하나요?? 만약 그렇다면 그 기준은 어떻게 되나요??

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

음, 살짝 헷갈리신것 같습니다만,,,, ^^;;

학습데이터와 테스트 데이터는 데이터 건수(행수)가 달라도 문제가 없습니다.  피처수(컬럼수)가 다른 경우는 예측을 할 수가 없습니다. 

그리고 학습 데이터에서 이상치를 삭제했을 때, 테스트 데이터에서도 비슷하게 이상치를 삭제하면 테스트 성능은 더 좋아질 수 있습니다. 다만 삭제시에는 이 이상치 데이터가 실제 데이터 환경에서 충분히 발생할 수 있는지/없는지에 따라 삭제를 결정하면 됩니다. 

감사합니다.