-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
선생님 질문있습니다.
21.11.16 03:15 작성 조회수 102
0
항상 좋은 강의 잘듣고 있습니다 :)
이상치 제거하고 검증용 세트로 모델 검증하는 과정에서 갑자기 궁금한게 생겨서 질문드립니다..!
이상치 제거한 모델을 실제 test 셋으로 평가 할때 행 수가 맞지 않잖아요..? 그럼 모델 평가가 안되는데
이경우에는 실제 test 세트에서도 인덱스를 제거하고 모델 평가를 하나요?? 만약 그렇다면 그 기준은 어떻게 되나요??
답변을 작성해보세요.
1
권 철민
지식공유자2021.11.17
안녕하십니까,
음, 살짝 헷갈리신것 같습니다만,,,, ^^;;
학습데이터와 테스트 데이터는 데이터 건수(행수)가 달라도 문제가 없습니다. 피처수(컬럼수)가 다른 경우는 예측을 할 수가 없습니다.
그리고 학습 데이터에서 이상치를 삭제했을 때, 테스트 데이터에서도 비슷하게 이상치를 삭제하면 테스트 성능은 더 좋아질 수 있습니다. 다만 삭제시에는 이 이상치 데이터가 실제 데이터 환경에서 충분히 발생할 수 있는지/없는지에 따라 삭제를 결정하면 됩니다.
감사합니다.
답변 1