강의

멘토링

커뮤니티

Inflearn Community Q&A

moimprivate1802's profile image
moimprivate1802

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Separation of training and test data sets

훈련데이터와 테스트데이터를 뽑을때 모집단의 특성이 잘 반영되는지 검증은 안해도 되나요?

Written on

·

173

0

실전에서
표본인 학습데이터와 테스트 데이터를 뽑을때 
모집단의 특성(parameter)를 대표하는지 검증을 해야하는지 궁금합니다.

python통계머신러닝 배워볼래요?

Answer 2

0

moimprivate1802님의 프로필 이미지
moimprivate1802
Questioner

충분히 답변이 된것 같습니다 감사합니다.

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

검증을 하면 좋을 것 같습니다.

하지만 보통 머신러닝 프로젝트 시에는 검증까지는 아니고, 학습 데이터/테스트 데이터 뽑을 때는 주로 Target 값의 분포도와 주요 feature 들의 값 분포도를 기반으로 학습/테스트 데이터를 맞추려고 노력합니다.

전체 데이터의 Target과 주요 feature들의 값 분포도에 맞게 보통 추출하려고 노력합니다.

감사합니다.

moimprivate1802's profile image
moimprivate1802

asked

Ask a question