[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Machine Learning Training and Evaluation (Classification)

roc_auc_score

2026-06-15T09:56:39.867Z

1 asked

from sklearn.metrics import roc_auc_score
roc_auc = roc_auc_score(y_val, pred[:, 1])

print('roc_auc: ', roc_auc)

11:19 즈음에 나오는 해당 코드에 궁금한 점이 있어 질문 드립니다. roc_auc_score() 메서드에 전달할 두 번째 아규먼트는 양성(positive)에 대응하는 클래스일 확률 리스트를 전달하는 것으로 알고 있습니다. 그런데 roc_auc_score() 메서드의 첫 번째 아규먼트에 전달하려는 값(y_val)이 0 또는 1로 이루어지지 않고 지금과 같이 '<=50K' 또는 '>50K'와 같은 문자열로 이루어진 리스트라면 roc_auc_score() 메서드 입장에서 도대체 어떻게 '<=50K'가 양성인지 '>50K'가 양성인지 판단할 수 있는 것인지 궁금합니다. 다른 수강생의 질문에서 print(rf.classes_)를 통해 보여지는 리스트의 인덱스 번호로 0이면 양성 X, 1이면 양성으로 판단한다라고 본 것 같은데, 해당 정보를 알고 있는 것(해당 정보를 저장한 주체)은 rf, 즉 랜덤포레스트 모델 객체 아닌가요? roc_auc_score() 입장에서는 rf.classes_ 속성에 직접 접근하지 않는 한, 해당 정보를 알지 못할 것 같은데 어떻게 '>50K'를 양성으로 판단하는지 궁금합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 0

추가질문 합니다

2026-06-15T07:23:01.745Z

시험환경 구름

2026-06-15T07:04:56.153Z

2유형 질문드려요

2026-06-15T06:24:34.899Z

RandomForest vs lgb

2026-06-15T01:09:37.269Z

전처리 관련질문

2026-06-14T22:49:54.479Z

작업형3 기출

2026-06-14T15:34:07.597Z

유형2에서 데이터분할 생략 가능여부

2026-06-14T14:58:35.447Z

9회 기출 유형3 질문

2026-06-14T14:12:52.249Z

lgb 기초편

2026-06-14T13:56:01.488Z

괄호 사용

2026-06-14T13:21:49.099Z

작업형 2 데이터 전처리 질문

2026-06-14T12:43:22.712Z

11회 기출 유형 작업형1 문제 3-1

2026-06-14T11:35:33.208Z

예시문제 작업형2 (ver2023) 질문입니다

2026-06-14T09:12:16.708Z

Data type에 따른 처리

2026-06-14T09:10:41.127Z

데이터 전처리 관련

2026-06-14T05:54:14.282Z

시험에서 문제 불러오기

2026-06-14T05:43:19.798Z

2번문제 출력값 질문

2026-06-14T04:35:05.224Z

pd.get_dummies()가 bool로 반환

2026-06-14T03:40:47.209Z

대응표본검정 레빈

2026-06-13T16:27:02.012Z

단일표본검정 문제 유형

2026-06-13T15:19:51.096Z

[작업형 3] 6~7. 카이제곱 검정

2026-06-13T14:06:56.468Z

9회 작업형3 문제 1-1

2026-06-13T13:42:16.035Z

최종답안 계산 방식 질문

2026-06-13T13:14:22.297Z

시험 치기 전 급하게 질문 사항

2026-06-13T11:36:55.206Z