강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

beassles7님의 프로필 이미지
beassles7

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV - 01

stratified k폴드 질문

작성

·

281

0

cross val score에서 분류모델이 입력되면 stratified로 교차검증을 시행하는데, stratified는 불균형한 데이터일 때 사용하는 것이 아닌가요? stratified를 균형적인 데이터에서도 사용해도 되는지 궁금합니다.

답변 2

0

선생님~ 질문과 답변을 보면서 의문이 든 게.. 

iris 데이터에서는 레이블값이 0,1,2 값이 각각 50개씩

원래 균형했던 데이터였었도 ..

KFold 하면 저렇게 학습과 검증데이터에서 불균형하게 분포가 되서 

Stratified KFold를 사용한 것 아니었나요..??

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

Target값이  불균형할 때 이를 균형있게 분리해 주는 것이기 때문에 균일한 데이터가 와도 균일하게 분리해주는 기능을 하기 때문에 상관없습니다. 다만 KFold보다 조금 더 시간이 걸릴 뿐입니다.

감사합니다.

beassles7님의 프로필 이미지
beassles7

작성한 질문수

질문하기