강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

freedom07님의 프로필 이미지
freedom07

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV - 01

cross_val_score() 에서 cv의 방법 관련

작성

·

235

0

선생님~

기존 cross_val_score() 에서 cv의 방법 관련된 

선생님의 답변에서 

'데이터를 '폴드' 방식으로 교차 검증 데이터 셋을 만들때, KFold와 StratifiedKFold를 이용합니다.
cross_val_score는 폴드 교차 검증 데이터 셋을 '분류'일때는 기본적으로 StratifiedKFold를 이용합니다.'

이렇게 답변 하신 것을 봤었습니다~

답변이 잘 이해가 되었는데 

제가 궁금한 것이

cross_val_score() 에서 함수 인자 중  estimator인자 로 Decisiontree같은 분류 방법이 들어가면 자동적으로 StratifiedKFold 방식이 적용되고

회귀 방법이 들어가면 KFold 방식이 적용이 된다는 말씀인건가요~? 

아니면 인자 중 지정하는 방법이 있는건가요~??

답변 3

0

권 철민님의 프로필 이미지
권 철민
지식공유자

넵!!

0

freedom07님의 프로필 이미지
freedom07
질문자

아 네네 ..!! 그러면 cross_val_score() 에서  '회귀'일 때는 KFold이고 '분류'일때에는  StratifiedKFold로 자동적으로 적용이 되는 건가요~? (아니면 사용자가 인자를 지정해줘야 하는 것인지 궁금했습니다..!)

0

권 철민님의 프로필 이미지
권 철민
지식공유자

회귀는 결과값이 숫자형 연속값이기때문에 결과값의 분포를 정할 수가 없습니다.

즉 레이블 A=20%, B=30%, C=30%와 같이 정해진 값으로 분포되지 않습니다. 따라서 StratifiedKFold를 적용할 수가 없습니다. 

freedom07님의 프로필 이미지
freedom07

작성한 질문수

질문하기