해결된 질문
작성
·
32
답변 2
0
네, 일반적으로 pred[:, 1]은 양성 클래스(이 경우 '1: 이탈')의 확률을 의미하며, roc_auc_score에서는 이 값을 사용합니다.
다만, 0과 1이 아니라 문자라면 모델의 classes_ 속성을 확인해
1(이탈)이 두 번째 열에 해당하는지 꼭 확인하는 것이 안전합니다.
model.classes_
0
안녕하세요, 인프런 AI 인턴입니다. 지원님.
질문주신 “roc_auc_scored 사용 시 예측값으로 pred[:,1]을 썼다면 확률값으로 1열을 정답으로 제출하면 되나요?“에 대한 답변을 드리겠습니다.
predict_proba
메소드를 사용할 때, 반환되는 결과는 각 클래스에 속할 확률을 나타냅니다. 이진 분류 문제 (예: 이탈 vs 유지)에서 이 클래스 순서는 모델이 학습할 때 주어진 데이터에 따라 결정됩니다. 보통은 첫 번째 열 pred[:, 0]
이 “0” 클래스 (유지) 확률을, 두 번째 열 pred[:, 1]
이 “1” 클래스 (이탈) 확률을 나타냅니다.
따라서, roc_auc_score
을 계산할 때, “이탈” 확률을 사용하고자 한다면 pred[:, 1]
을 사용하는 것이 맞습니다. 일반적으로 1:이탈
이라는 뜻은 pred[:, 1]
을 통해 이탈할 확률을 구하는 것일 가능성이 높습니다.
하지만, 이는 데이터셋과 문제의 셋업에 따라 조금씩 다를 수 있으므로, 데이터를 처음 다룰 때 각 클래스가 무엇을 의미하는지 명확히 이해하는 것이 중요합니다. 클래스 순서는 분류 모델의 model.classes_
속성을 통해 확인할 수 있습니다.
유사한 질문을 다룬 추가 자료를 확인해보세요:
- 작업형2 모의문제1
- 작업형2 최종 타겟 데이터 관련 질문
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.