해결된 질문
작성
·
24
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
안녕하세요 평가지표 중 roc_auc_score 학습 중에 궁금한 사항이 있어서 질문드립니다.
강의나 시나공, 기출 다 이진분류 0, 1 중 1을 양성으로 예측하는 문제가 있어서
반대로 0일 확률을 예측하고 평가하는 경우 어떻게 처리해야하는지 궁금해서요..!!
rf = RandomForestClassifier(random_state = 0)
rf.fit(X_tr, y_tr)
그리고 rf.classes_ 로 확인해보면 [0, 1] 일 때,
y_pred_rf = rf.predict_proba(X_val)
그리고 roc_auc_score에서
roc_auc_score(y_val, y_pred_rf[:, 0]) 이렇게 첫 번째 클래스(0일 확률)를 입력하면 자동으로 0을 양성으로 계산해서 모형평가가 이루어지는 건가요?
아니면 pos_label = 0 이라고 지정을 하거나, 별도의 방법이 필요한가요?!
그리고 분류 클래스가 문자형(A, B)인 경우에는(rf.classes_도 [A, B])
roc_auc_score(y_val, y_pred[: , 1]) 이렇게 하면 자동으로 B를 양성으로 인식하는 게 맞는지 궁금합니다 !!
(이경우에도 A 확률을 평가하려면
y_pred[:, 0]으로 하고 pos_label = 'A'라고 해야하는지도 ㅠㅜ)
감사합니다 :)
답변 2
0
타겟이 숫자(0과 1)일때는 pos_label 지정할 필요가 없어요. 1이 양성입니다.
타겟이 문자일 때는 pos_label로 지정이 필요하고
rf.classes_를 확인(컬럼 순서임)해서 해당 양성 컬럼을 선택해 주면 됩니다.
(rf.classes_ [A, B]) 라면
roc_auc_score(y_val, y_pred[: , 1]) B를 선택하는 것입니다.
0
안녕하세요, 인프런 AI 인턴입니다.
coeffect님께서 질문하신 내용은 머신러닝 이진 분류에서 roc_auc_score
함수를 사용할 때, “양성” 클래스가 0인 경우를 어떻게 처리할지에 대한 부분입니다. 이 문제는 모델 평가 시 올바른 결과를 얻기 위해 매우 중요한 부분입니다.
roc_auc_score
함수의 기본 동작기본적으로 roc_auc_score
함수는 두 클래스가 있을 때 높은 클래스 레이블(보통 1)을 “양성”으로 간주하여 AUC를 계산합니다. 그러나 특정 상황에서는 “양성” 클래스가 0인 경우도 있을 수 있습니다.
y_pred_rf[:, 0]
을 사용하여 0의 확률을 입력하면, roc_auc_score
함수는 기본적으로 1을 양성으로 간주하므로 직접적으로 0을 양성으로 처리하지 않습니다."pos_label=0"
을 명시적으로 설정해야 합니다. roc_auc_score(y_val, y_pred_rf[:, 0], pos_label=0)
y_pred[:, 1]
이 “양성”으로 인식됩니다.pos_label
파라미터를 사용하여 정확한 설정을 해줘야 합니다. roc_auc_score(y_val, y_pred[:, 0], pos_label='A') # A를 양성 클래스로 인식
관련된 질문을 다룬 게시물들을 아래에 링크합니다. 도움이 될 수 있는 정보를 포함하고 있으니 참고하시기 바랍니다:
predict_proba
와 확률 해석에 관한 질문저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.