강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

차재훈님의 프로필 이미지
차재훈

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

Test 데이터도 전처리 하나요?

작성

·

986

0

안녕하세요, 질문 사항이 또 있어 글 남깁니다.

 

질문1) Train데이터에서 결측치 및 이상치를 대체하는 작업을 했다면, Test 데이터도 동일하게 전처리 (결측값, 이상치 등) 작업을 진행해야 하나요?

 

질문2) 원본 데이터의 변수가 a,b,c,d,e,f로  독립변수 5개(a,b,c,d,e), 결과변수1개(f)라고 가정할때,

전처리를 하여 Train데이터에서 사용한 변수가 a,c,d 이면 Test 데이터에서도 a,c,d 변수만 사용해서 분석해야 하나요?

 

감사합니다~^^

답변 1

0

companionclub님의 프로필 이미지
companionclub
지식공유자

 

안녕하세요.

테스트 데이터도 전처리가 필요합니다. 꼭 해야된다고 하기는 어렵지만 일반적으로 통상적으로

동일한 방법으로 전처리를 진행합니다. 스크립트도 그렇게 제공했습니다.

 

또한 Train데이터와 Test 데이터의 변수는 완벽히 동일해야 합니다.

Train할때 변수와 Test할때 변수가 다르면(갯수) 결과 산출이 되지 않습니다.

차재훈님의 프로필 이미지
차재훈

작성한 질문수

질문하기