인프런 커뮤니티 질문&답변

tkwkdlq님의 프로필 이미지
tkwkdlq

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

X_test 결측치 질문

해결된 질문

작성

·

286

1

스크린샷 2023-11-09 오후 10.31.41.pngX_test 결측치를 채울때 'age' 와 'hours.per.week' 컬럼은 왜 X_test의 평균이 아니라 X_train으로 채우나요? 단순 오타인가요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

X_test 데이터셋의 결측치를 채울 때 X_train의 평균값을 사용하는 것은 오타가 아니라 일반적인 머신러닝 데이터 전처리의 한 방법이에요~!

전문 용어로 말하면 데이터 누수(data leakage)를 방지하기 위함입니다.

tkwkdlq님의 프로필 이미지
tkwkdlq
질문자

앗 감사합니다!

tkwkdlq님의 프로필 이미지
tkwkdlq

작성한 질문수

질문하기