작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
286
1
X_test 결측치를 채울때 'age' 와 'hours.per.week' 컬럼은 왜 X_test의 평균이 아니라 X_train으로 채우나요? 단순 오타인가요?
답변 1
0
X_test 데이터셋의 결측치를 채울 때 X_train의 평균값을 사용하는 것은 오타가 아니라 일반적인 머신러닝 데이터 전처리의 한 방법이에요~!
전문 용어로 말하면 데이터 누수(data leakage)를 방지하기 위함입니다.
앗 감사합니다!
앗 감사합니다!