강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

coeffect님의 프로필 이미지
coeffect

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표 (이진/다중 분류, 회귀)

이진분류에서 양성이 0일 때, roc_auc_score 적용..

해결된 질문

작성

·

24

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

 

안녕하세요 평가지표 중 roc_auc_score 학습 중에 궁금한 사항이 있어서 질문드립니다.

 

강의나 시나공, 기출 다 이진분류 0, 1 중 1을 양성으로 예측하는 문제가 있어서

 

반대로 0일 확률을 예측하고 평가하는 경우 어떻게 처리해야하는지 궁금해서요..!!

 

rf = RandomForestClassifier(random_state = 0)

rf.fit(X_tr, y_tr)

 

그리고 rf.classes_ 로 확인해보면 [0, 1] 일 때,

y_pred_rf = rf.predict_proba(X_val)

 

그리고 roc_auc_score에서

roc_auc_score(y_val, y_pred_rf[:, 0]) 이렇게 첫 번째 클래스(0일 확률)를 입력하면 자동으로 0을 양성으로 계산해서 모형평가가 이루어지는 건가요?

아니면 pos_label = 0 이라고 지정을 하거나, 별도의 방법이 필요한가요?!

 

 

 

그리고 분류 클래스가 문자형(A, B)인 경우에는(rf.classes_도 [A, B])

roc_auc_score(y_val, y_pred[: , 1]) 이렇게 하면 자동으로 B를 양성으로 인식하는 게 맞는지 궁금합니다 !!

 

(이경우에도 A 확률을 평가하려면

y_pred[:, 0]으로 하고 pos_label = 'A'라고 해야하는지도 ㅠㅜ)

 

감사합니다 :)

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  • 타겟이 숫자(0과 1)일때는 pos_label 지정할 필요가 없어요. 1이 양성입니다.

  • 타겟이 문자일 때는 pos_label로 지정이 필요하고
    rf.classes_를 확인(컬럼 순서임)해서 해당 양성 컬럼을 선택해 주면 됩니다.
    (rf.classes_ [A, B]) 라면

    roc_auc_score(y_val, y_pred[: , 1]) B를 선택하는 것입니다.

0

안녕하세요, 인프런 AI 인턴입니다.

coeffect님께서 질문하신 내용은 머신러닝 이진 분류에서 roc_auc_score 함수를 사용할 때, “양성” 클래스가 0인 경우를 어떻게 처리할지에 대한 부분입니다. 이 문제는 모델 평가 시 올바른 결과를 얻기 위해 매우 중요한 부분입니다.

roc_auc_score 함수의 기본 동작

기본적으로 roc_auc_score 함수는 두 클래스가 있을 때 높은 클래스 레이블(보통 1)을 “양성”으로 간주하여 AUC를 계산합니다. 그러나 특정 상황에서는 “양성” 클래스가 0인 경우도 있을 수 있습니다.

양성이 0인 경우 처리 방법

  1. 숫자 레이블일 때:
    • y_pred_rf[:, 0]을 사용하여 0의 확률을 입력하면, roc_auc_score 함수는 기본적으로 1을 양성으로 간주하므로 직접적으로 0을 양성으로 처리하지 않습니다.
    • 따라서 "pos_label=0"을 명시적으로 설정해야 합니다.
   roc_auc_score(y_val, y_pred_rf[:, 0], pos_label=0)
  1. 문자 레이블일 때 (A, B 등):
    • 기본적으로는 y_pred[:, 1]이 “양성”으로 인식됩니다.
    • 문자형 레이블에서도 “양성” 클래스가 무엇인지 명시해야 하므로, 필요에 따라 pos_label 파라미터를 사용하여 정확한 설정을 해줘야 합니다.
   roc_auc_score(y_val, y_pred[:, 0], pos_label='A')  # A를 양성 클래스로 인식

레퍼런스 자료

관련된 질문을 다룬 게시물들을 아래에 링크합니다. 도움이 될 수 있는 정보를 포함하고 있으니 참고하시기 바랍니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

coeffect님의 프로필 이미지
coeffect

작성한 질문수

질문하기