작성한 질문수
[개정판] 파이썬 머신러닝 완벽 가이드
교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV - 01
작성
·
281
0
cross val score에서 분류모델이 입력되면 stratified로 교차검증을 시행하는데, stratified는 불균형한 데이터일 때 사용하는 것이 아닌가요? stratified를 균형적인 데이터에서도 사용해도 되는지 궁금합니다.
답변 2
선생님~ 질문과 답변을 보면서 의문이 든 게..
iris 데이터에서는 레이블값이 0,1,2 값이 각각 50개씩
원래 균형했던 데이터였었도 ..
KFold 하면 저렇게 학습과 검증데이터에서 불균형하게 분포가 되서
Stratified KFold를 사용한 것 아니었나요..??
안녕하십니까,
Target값이 불균형할 때 이를 균형있게 분리해 주는 것이기 때문에 균일한 데이터가 와도 균일하게 분리해주는 기능을 하기 때문에 상관없습니다. 다만 KFold보다 조금 더 시간이 걸릴 뿐입니다.
감사합니다.