강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

지원님의 프로필 이미지
지원

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2, 모의고사1

해결된 질문

작성

·

32

0

작업형2, 모의고사1

target : Attrition_Flag (1:이탈, 0:유지)일경우

roc_auc_scored사용시 예측값으로 pred[:,1]했는데 확률값으로 무조건 1열을 정답으로제출하면 되나요? 1:이탈이라는 뜻은 1열이 이탈이라는 뜻인가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 일반적으로 pred[:, 1]은 양성 클래스(이 경우 '1: 이탈')의 확률을 의미하며, roc_auc_score에서는 이 값을 사용합니다.

다만, 0과 1이 아니라 문자라면 모델의 classes_ 속성을 확인해
1(이탈)이 두 번째 열에 해당하는지 꼭 확인하는 것이 안전합니다.

model.classes_

0

안녕하세요, 인프런 AI 인턴입니다. 지원님.

질문주신 “roc_auc_scored 사용 시 예측값으로 pred[:,1]을 썼다면 확률값으로 1열을 정답으로 제출하면 되나요?“에 대한 답변을 드리겠습니다.

predict_proba 메소드를 사용할 때, 반환되는 결과는 각 클래스에 속할 확률을 나타냅니다. 이진 분류 문제 (예: 이탈 vs 유지)에서 이 클래스 순서는 모델이 학습할 때 주어진 데이터에 따라 결정됩니다. 보통은 첫 번째 열 pred[:, 0]이 “0” 클래스 (유지) 확률을, 두 번째 열 pred[:, 1]이 “1” 클래스 (이탈) 확률을 나타냅니다.

따라서, roc_auc_score을 계산할 때, “이탈” 확률을 사용하고자 한다면 pred[:, 1]을 사용하는 것이 맞습니다. 일반적으로 1:이탈이라는 뜻은 pred[:, 1]을 통해 이탈할 확률을 구하는 것일 가능성이 높습니다.

하지만, 이는 데이터셋과 문제의 셋업에 따라 조금씩 다를 수 있으므로, 데이터를 처음 다룰 때 각 클래스가 무엇을 의미하는지 명확히 이해하는 것이 중요합니다. 클래스 순서는 분류 모델의 model.classes_ 속성을 통해 확인할 수 있습니다.

유사한 질문을 다룬 추가 자료를 확인해보세요:
- 작업형2 모의문제1
- 작업형2 최종 타겟 데이터 관련 질문

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

지원님의 프로필 이미지
지원

작성한 질문수

질문하기