강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

Ha Yeon Won님의 프로필 이미지
Ha Yeon Won

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

LightGBM을 이용한 위스콘신 유방암 예측

evaluation dataset 질문

작성

·

158

0

evaluation은 검증단계이므로 test dataset을 사용하면 안된다고 하셨는데, 강의에서 evals = [(X_test, y_test)]로 하는 것은 test dataset을 사용하는 것이 아닌가요? 여기선 왜 test dataset을 사용하는지 궁금합니다.

답변 1

3

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

네 맞습니다. evaluation은 검증단계 이므로 최종 테스트용 test dataset을 사용하면 오버피팅의 가능성이 발생할 수 있기에 일반적으로 사용하지 않습니다.  강의에서는 학습 데이터 세트 건수가 작을 뿐 아니라 학습 데이터를 다시 검증용 데이터로 나누고, 학습/evaluation 하기가 오히려 더 여러분이 학습하기에 번거로울것 같아서 간략하게 test dataset를 검증 데이터로 적용하였으니 양해 부탁드립니다. 

감사합니다.

Ha Yeon Won님의 프로필 이미지
Ha Yeon Won

작성한 질문수

질문하기