강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

co choi님의 프로필 이미지
co choi

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

선생님 질문있습니다.

작성

·

165

0

항상 좋은 강의 잘듣고 있습니다 :)

 

이상치 제거하고 검증용 세트로 모델 검증하는 과정에서 갑자기 궁금한게 생겨서 질문드립니다..!

이상치 제거한 모델을 실제 test 셋으로 평가 할때 행 수가 맞지 않잖아요..? 그럼 모델 평가가 안되는데

이경우에는 실제 test 세트에서도 인덱스를 제거하고 모델 평가를 하나요?? 만약 그렇다면 그 기준은 어떻게 되나요??

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

음, 살짝 헷갈리신것 같습니다만,,,, ^^;;

학습데이터와 테스트 데이터는 데이터 건수(행수)가 달라도 문제가 없습니다.  피처수(컬럼수)가 다른 경우는 예측을 할 수가 없습니다. 

그리고 학습 데이터에서 이상치를 삭제했을 때, 테스트 데이터에서도 비슷하게 이상치를 삭제하면 테스트 성능은 더 좋아질 수 있습니다. 다만 삭제시에는 이 이상치 데이터가 실제 데이터 환경에서 충분히 발생할 수 있는지/없는지에 따라 삭제를 결정하면 됩니다. 

감사합니다. 

co choi님의 프로필 이미지
co choi

작성한 질문수

질문하기