강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

Baek Kyun Shin님의 프로필 이미지
Baek Kyun Shin

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런으로 수행하는 타이타닉 생존자 예측 - 02

CV관련 질문

작성

·

141

1

안녕하세요. 강의 잘 듣고 있습니다.

In[22]에서는 for문을 돌며 CV를 수행하고, In[23]에서는 cross_val_score로 간단하게 CV를 수행했습니다.

하지만 교차 검증의 정확도가 서로 다릅니다. for문으로 수행하는 것과 cross_val_score로 수행하는 것이 같다고 말씀하신 것 같은데 정확도가 다른 이유가 무엇인지요?

교차 검증 train, test 데이터를 선택하는 기준이 서로 다른 것인가요?

감사합니다.

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

ln[22]의 for loop는 KFold를 이용하였습니다.

cross_val_score()는 일반적으로 분류에서는 StratifiedKFold, 회귀에서는 KFold를 사용합니다.

타이타닉 예제는 분류이기 때문에 cross_val_score()가 StratifiedKFold를 이용했기 때문에 ln[22]와 약간의 차이가 발생할 수 있습니다.

감사합니다.

Baek Kyun Shin님의 프로필 이미지
Baek Kyun Shin

작성한 질문수

질문하기