• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

균형데이터라 해도 분류일 경우에는, Stratified KFold를 써야하는 게..

21.02.18 12:31 작성 조회수 215

0

선생님~

iris데이터 같은 경우에는

레이블값 0,1,2각 전체 데이터에서 각각 50개씩 균형있게 들어가 있는 데이터 잖아요~?

이러한 균형 데이터라해도, 알고리즘이 '분류'일 경우에는, 

교차검증시 Stratified KFold를 사용해야 하는 거지요~?

교차검증 K폴드 관련 이론 설명해주실 때 ,

일반 KFold와 Stratified KFold 부분에서

 'Stratified KFold'는 불균형한 분포도를 가진 레이블 데이터 집합을 위한 방식이라고 설명해주셨었는데요..

iris 같은 경우는 균형적인 분포도를 가진 데이터인데도 

 KFold를 하면 이렇게 이상하게 되니...

답변 1

답변을 작성해보세요.

1

이건 iris label값이 순차적으로 정렬이 되어 있기 때문에 나타나는 현상입니다. 보통은 데이터가 iris 데이터 label처럼 순차적으로 정렬되어 있지 않기 때문에 K Fold를 사용해도 큰 문제가 없습니다.