강의

멘토링

커뮤니티

Inflearn Community Q&A

fkddl14369605's profile image
fkddl14369605

asked

[Revised Edition] The Complete Guide to Python Machine Learning

신용카드 사기 예측 실습 이상치 실습 질문

Resolved

Written on

·

325

1

이상치 제거 할때 train set에서만 이상치를 제거해야 되지 않나요? 실습때는 train, test를 나누기 전에 이상치를 먼저 제거해서 test set에서도 제거 되는것 같습니다.

python머신러닝통계

Answer 1

1

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

네, 맞습니다 Test 데이터 세트에서 제거 하셔도 됩니다.

다만 이상치 제거시 생각해볼 사항이 있습니다.

실제 예측에 사용되는 데이터가 이상치를 포함한 데이터가 사용될수도 있습니다.

그러니까 학습 데이터와는 달리 예측(즉 test 데이터)에 사용되는 데이터는 이상치가 포함될 수 있는 상황이라면 test 데이터의 이상치를 삭제하지 않고 예측 성능을 측정하는 것이 좋습니다.

감사합니다.

fkddl14369605's profile image
fkddl14369605

asked

Ask a question