-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
균형데이터라 해도 분류일 경우에는, Stratified KFold를 써야하는 게..
21.02.18 12:31 작성 조회수 215
0
선생님~
iris데이터 같은 경우에는
레이블값 0,1,2각 전체 데이터에서 각각 50개씩 균형있게 들어가 있는 데이터 잖아요~?
이러한 균형 데이터라해도, 알고리즘이 '분류'일 경우에는,
교차검증시 Stratified KFold를 사용해야 하는 거지요~?
교차검증 K폴드 관련 이론 설명해주실 때 ,
일반 KFold와 Stratified KFold 부분에서
'Stratified KFold'는 불균형한 분포도를 가진 레이블 데이터 집합을 위한 방식이라고 설명해주셨었는데요..
iris 같은 경우는 균형적인 분포도를 가진 데이터인데도
KFold를 하면 이렇게 이상하게 되니...
답변을 작성해보세요.
1
권 철민
지식공유자2021.02.18
이건 iris label값이 순차적으로 정렬이 되어 있기 때문에 나타나는 현상입니다. 보통은 데이터가 iris 데이터 label처럼 순차적으로 정렬되어 있지 않기 때문에 K Fold를 사용해도 큰 문제가 없습니다.
답변 1