강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

co choi님의 프로필 이미지
co choi

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

배깅(Bagging)과 랜덤 포레스트(Random Forest)의 이해

score(X_train, Y_train) 이부분 이해가 ㅠㅠ

작성

·

1.1K

0

logreg = LogisticRegression()

logreg.fit(X_train, Y_train)

Y_pred = logreg.predict(X_test)

logreg.score(X_train, Y_train)

which gives: 0.80471380471380471

I use to use this method instead to determine my model accuracy:

from sklearn.metrics import classification_report

logreg = LogisticRegression()

logreg.fit(X_train, Y_train)

y_pred = logreg.predict(X_test)

print(classification_report(y_test, y_pred))

선생님 score(X_train, Y_train)이부분이 이해가 가질 않습니다ㅠㅠ 어떻게 y_test없이 train세트만으로 정확도 측정이 가능한거죠?? 혼자 알려고해도 알수가 없네요ㅠ 자세한 답변 부탁드리겠습니다!!

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

음, logreg.score(X_train, Y_train)는 학습데이터로 학습된 모델의 평가를 다시 학습데이터로 했군요. 바람직하지는 않습니다. 

그리고 model의 score 는 더 이상 scikit learn에서 지원이 안되는 걸로 알고 있습니다만, 아직도 구동이 되는가 보군요. score() 보다는 accuracy_score(y_test, y_pred)로 변경을 권장드립니다. 코드 자체가 좀 옛날 코드 인것 같습니다. 

감사합니다.

co choi님의 프로필 이미지
co choi

작성한 질문수

질문하기