인프런 커뮤니티 질문&답변
score(X_train, Y_train) 이부분 이해가 ㅠㅠ
작성
·
1.1K
0
logreg = LogisticRegression()
logreg.fit(X_train, Y_train)
Y_pred = logreg.predict(X_test)
logreg.score(X_train, Y_train)
which gives: 0.80471380471380471
I use to use this method instead to determine my model accuracy:
from sklearn.metrics import classification_report
logreg = LogisticRegression()
logreg.fit(X_train, Y_train)
y_pred = logreg.predict(X_test)
print(classification_report(y_test, y_pred))
선생님 score(X_train, Y_train)이부분이 이해가 가질 않습니다ㅠㅠ 어떻게 y_test없이 train세트만으로 정확도 측정이 가능한거죠?? 혼자 알려고해도 알수가 없네요ㅠ 자세한 답변 부탁드리겠습니다!!
퀴즈
결정 트리(Decision Tree) 모델이 데이터를 분할(Split)할 때 사용하는 주요 기준 지표로 가장 적절한 것은 무엇일까요?
평균 제곱 오차 (Mean Squared Error)
정보 이득 (Information Gain) 또는 지니 계수 (Gini Coefficient)
회귀 계수 (Regression Coefficient)
주성분 (Principal Component)
답변 1
0
안녕하십니까,
음, logreg.score(X_train, Y_train)는 학습데이터로 학습된 모델의 평가를 다시 학습데이터로 했군요. 바람직하지는 않습니다.
그리고 model의 score 는 더 이상 scikit learn에서 지원이 안되는 걸로 알고 있습니다만, 아직도 구동이 되는가 보군요. score() 보다는 accuracy_score(y_test, y_pred)로 변경을 권장드립니다. 코드 자체가 좀 옛날 코드 인것 같습니다.
감사합니다.





