강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

김태훈님의 프로필 이미지
김태훈

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

교차검증 - K-Fold와 Stratified K-Fold의 이해 - 01

mean_train_score vs. mean_test_score 차이

작성

·

633

1

안녕하세요.

GridSearchCV 예제코드에서 return_train_score를 하면 mean_train_score를 구할수 있는데요.

'''

from sklearn.model_selection import GridSearchCV

params = {

    'max_depth' : [ 6, 8 ,10, 12, 16 ,20, 24]

}

grid_cv = GridSearchCV(dt_clf, param_grid=params, scoring='accuracy', cv=5, verbose=1,return_train_score=True )

grid_cv.fit(X_train , y_train)

grid_cv.cv_results_

'''

mean_test_score는 CV를 통해서 나눠진 하나의 validation dataset으로 구한 score (즉,  validation score)를 말하는것 같긴한데, 맞나요?

만약 그렇다면 mean_train_score는 무엇을 말하나요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

네,  맞습니다. mean_test_score는 cv=5 일때 5개 validation set에서 구한 score를 평균한 것입니다. 그리고 max_depth가 7개 이므로 7개의 평균값이 리스트 형태로 제공 됩니다.  일반적으로 mean_test_score만 신경 쓰시면 됩니다.

main_train_score는 마찬가지로 cv=5 일때 5개 train set에서 구한 score를 평균한 것입니다. 하지만 train set의 평균값은 overfitting 된것이므로 크게 신경쓰지 않으셔도 됩니다.

김태훈님의 프로필 이미지
김태훈

작성한 질문수

질문하기