Inflearn Community Q&A
mean_train_score vs. mean_test_score 차이
Written on
·
625
1
안녕하세요.
GridSearchCV 예제코드에서 return_train_score를 하면 mean_train_score를 구할수 있는데요.
'''
from sklearn.model_selection import GridSearchCV
params = {
'max_depth' : [ 6, 8 ,10, 12, 16 ,20, 24]
}
grid_cv = GridSearchCV(dt_clf, param_grid=params, scoring='accuracy', cv=5, verbose=1,return_train_score=True )
grid_cv.fit(X_train , y_train)
grid_cv.cv_results_
'''
mean_test_score는 CV를 통해서 나눠진 하나의 validation dataset으로 구한 score (즉, validation score)를 말하는것 같긴한데, 맞나요?
만약 그렇다면 mean_train_score는 무엇을 말하나요?
Answer 1
1
안녕하십니까,
네, 맞습니다. mean_test_score는 cv=5 일때 5개 validation set에서 구한 score를 평균한 것입니다. 그리고 max_depth가 7개 이므로 7개의 평균값이 리스트 형태로 제공 됩니다. 일반적으로 mean_test_score만 신경 쓰시면 됩니다.
main_train_score는 마찬가지로 cv=5 일때 5개 train set에서 구한 score를 평균한 것입니다. 하지만 train set의 평균값은 overfitting 된것이므로 크게 신경쓰지 않으셔도 됩니다.





