인프런 커뮤니티 질문&답변
Test 데이터도 전처리 하나요?
작성
·
986
0
안녕하세요, 질문 사항이 또 있어 글 남깁니다.
질문1) Train데이터에서 결측치 및 이상치를 대체하는 작업을 했다면, Test 데이터도 동일하게 전처리 (결측값, 이상치 등) 작업을 진행해야 하나요?
질문2) 원본 데이터의 변수가 a,b,c,d,e,f로 독립변수 5개(a,b,c,d,e), 결과변수1개(f)라고 가정할때,
전처리를 하여 Train데이터에서 사용한 변수가 a,c,d 이면 Test 데이터에서도 a,c,d 변수만 사용해서 분석해야 하나요?
감사합니다~^^
답변 1
0
companionclub
지식공유자
안녕하세요.
테스트 데이터도 전처리가 필요합니다. 꼭 해야된다고 하기는 어렵지만 일반적으로 통상적으로
동일한 방법으로 전처리를 진행합니다. 스크립트도 그렇게 제공했습니다.
또한 Train데이터와 Test 데이터의 변수는 완벽히 동일해야 합니다.
Train할때 변수와 Test할때 변수가 다르면(갯수) 결과 산출이 되지 않습니다.





