인프런 커뮤니티 질문&답변
데이터셋 분리와 관련하여 질문이 있습니다.
작성
·
411
답변 1
0
대구빅데이터활용센터
지식공유자
안녕하세요.
데이터가 많을 때는 큰 문제가 안됩니다.
다만, 데이터가 부족할 경우 훈련용 데이터에만 있는 속성으로
학습하여 예측을 할 경우 오류가 발생합니다.
예를 들면 훈련용 데이터의 변수가 옷의 색깔(빨강, 노랑)로 학습한 후
테스트 데이터 예측시 테스트 데이터의 변수(빨강, 노랑, 파랑)가 일 경우
기존에 없었던 속성이 있으므로 에러가 발생합니다.
이상입니다.





