• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

test에서 결측치가 발생할 경우

23.11.28 08:45 작성 23.11.28 08:52 수정 조회수 123

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

질문 : test에서 결측치가 발생할 경우엔 행을 삭제 못하나요?

 

test 파일의 경우 저희가 시험장에서 볼 수 있는 것은 X_test 파일이고, y_test는 저희가 볼 수 없는 파일이잖아요. 그럼 X_test의 행을 삭제하면 오류가 뜨나요? 예를 들어 X_test에서 행이 50개인데 행을 3개 삭제하면, y_test는 50개이니까 평가가 불가능하지 않을까 싶습니다. 즉, test에는 결측치가 발생하면 X_test.fillna()를 통해 대체를 할 수 있지, X_test.dropna()처럼 행을 삭제할 수 없나요?

 

강의 때 올려주신 예시문제나 기출문제 해설을 봐도 작업형2에는 모두 결측치가 없어서, 이렇게 질문으로 올립니다.

 

시험이 다가오니 사소해 보이는 질문도 확인을 받고 싶네요 ㅠㅠ 항상 감사합니다

답변 1

답변을 작성해보세요.

0

네, 아직 결측치가 나온적이 없습니다.

test의 행을 삭제하면 오류가 뜨나요? -> 아니요 그래서 조심해야 합니다. 오류는 나지 않고 제출 시 0점 처리 됩니다.

test는 절대로 행을 삭제하면 안 됩니다.

대체값을 대입하거나 결측값이 50%이상 넘어가는 컬럼이라면 train과 test동일하게 컬럼 삭제는 가능합니다.