강의

멘토링

커뮤니티

Inflearn Community Q&A

kingmbc's profile image
kingmbc

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Cross-validation - Understanding K-Fold and Stratified K-Fold - 01

mean_train_score vs. mean_test_score 차이

Written on

·

625

1

안녕하세요.

GridSearchCV 예제코드에서 return_train_score를 하면 mean_train_score를 구할수 있는데요.

'''

from sklearn.model_selection import GridSearchCV

params = {

    'max_depth' : [ 6, 8 ,10, 12, 16 ,20, 24]

}

grid_cv = GridSearchCV(dt_clf, param_grid=params, scoring='accuracy', cv=5, verbose=1,return_train_score=True )

grid_cv.fit(X_train , y_train)

grid_cv.cv_results_

'''

mean_test_score는 CV를 통해서 나눠진 하나의 validation dataset으로 구한 score (즉,  validation score)를 말하는것 같긴한데, 맞나요?

만약 그렇다면 mean_train_score는 무엇을 말하나요?

python머신러닝 배워볼래요? 통계

Answer 1

1

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

네,  맞습니다. mean_test_score는 cv=5 일때 5개 validation set에서 구한 score를 평균한 것입니다. 그리고 max_depth가 7개 이므로 7개의 평균값이 리스트 형태로 제공 됩니다.  일반적으로 mean_test_score만 신경 쓰시면 됩니다.

main_train_score는 마찬가지로 cv=5 일때 5개 train set에서 구한 score를 평균한 것입니다. 하지만 train set의 평균값은 overfitting 된것이므로 크게 신경쓰지 않으셔도 됩니다.

kingmbc's profile image
kingmbc

asked

Ask a question