해결된 질문
작성
·
208
·
수정됨
답변 1
0
일반적으로 결측치가 있다면 train 데이터의 결과로 -> test데이터에 적용합니다.
다만 문제에서 test데이터의 평균, 최빈값 들을 사용하지 말라는 말이 없다면 성능을 높이기 위해 사용하기도 합니다. 이 때 데이터 누수가 발생한다고 흔히 이야기 해요~~!!
해당 건은 제가 통일을 하는 것이 좋았을텐데 혼란스럽게 했네요!! 보완해 볼게요!!
참고로 6회 이전까진 작업형2에서 결측치가 있는 데이터가 제공된 적이 없어 없습니다.