강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

freedom07님의 프로필 이미지
freedom07

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

교차검증 - K-Fold와 Stratified K-Fold의 이해 - 01

균형데이터라 해도 분류일 경우에는, Stratified KFold를 써야하는 게..

작성

·

340

0

선생님~

iris데이터 같은 경우에는

레이블값 0,1,2각 전체 데이터에서 각각 50개씩 균형있게 들어가 있는 데이터 잖아요~?

이러한 균형 데이터라해도, 알고리즘이 '분류'일 경우에는, 

교차검증시 Stratified KFold를 사용해야 하는 거지요~?

교차검증 K폴드 관련 이론 설명해주실 때 ,

일반 KFold와 Stratified KFold 부분에서

 'Stratified KFold'는 불균형한 분포도를 가진 레이블 데이터 집합을 위한 방식이라고 설명해주셨었는데요..

iris 같은 경우는 균형적인 분포도를 가진 데이터인데도 

 KFold를 하면 이렇게 이상하게 되니...

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

이건 iris label값이 순차적으로 정렬이 되어 있기 때문에 나타나는 현상입니다. 보통은 데이터가 iris 데이터 label처럼 순차적으로 정렬되어 있지 않기 때문에 K Fold를 사용해도 큰 문제가 없습니다.

freedom07님의 프로필 이미지
freedom07

작성한 질문수

질문하기