강의

멘토링

커뮤니티

Inflearn Community Q&A

werooring1287's profile image
werooring1287

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Titanic Survivor Prediction with Scikit-learn - 02

CV관련 질문

Written on

·

139

1

안녕하세요. 강의 잘 듣고 있습니다.

In[22]에서는 for문을 돌며 CV를 수행하고, In[23]에서는 cross_val_score로 간단하게 CV를 수행했습니다.

하지만 교차 검증의 정확도가 서로 다릅니다. for문으로 수행하는 것과 cross_val_score로 수행하는 것이 같다고 말씀하신 것 같은데 정확도가 다른 이유가 무엇인지요?

교차 검증 train, test 데이터를 선택하는 기준이 서로 다른 것인가요?

감사합니다.

python머신러닝 배워볼래요? 통계

Answer 1

1

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

ln[22]의 for loop는 KFold를 이용하였습니다.

cross_val_score()는 일반적으로 분류에서는 StratifiedKFold, 회귀에서는 KFold를 사용합니다.

타이타닉 예제는 분류이기 때문에 cross_val_score()가 StratifiedKFold를 이용했기 때문에 ln[22]와 약간의 차이가 발생할 수 있습니다.

감사합니다.

werooring1287's profile image
werooring1287

asked

Ask a question