• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

신용카드 사기 예측 실습 이상치 실습 질문

23.05.21 11:12 작성 조회수 220

1

이상치 제거 할때 train set에서만 이상치를 제거해야 되지 않나요? 실습때는 train, test를 나누기 전에 이상치를 먼저 제거해서 test set에서도 제거 되는것 같습니다.

답변 1

답변을 작성해보세요.

1

안녕하십니까,

네, 맞습니다 Test 데이터 세트에서 제거 하셔도 됩니다.

다만 이상치 제거시 생각해볼 사항이 있습니다.

실제 예측에 사용되는 데이터가 이상치를 포함한 데이터가 사용될수도 있습니다.

그러니까 학습 데이터와는 달리 예측(즉 test 데이터)에 사용되는 데이터는 이상치가 포함될 수 있는 상황이라면 test 데이터의 이상치를 삭제하지 않고 예측 성능을 측정하는 것이 좋습니다.

감사합니다.