강의

멘토링

커뮤니티

Inflearn Community Q&A

ash080886840's profile image
ash080886840

asked

[After Work Side Projects] Big Data Analytics Engineer Practical Exam (Task Types 1, 2, 3)

Evaluation Metrics (Binary/Multi-class Classification, Regression)

f1 스코어에 관련된 질문입니다.

Resolved

Written on

·

308

0

이진분류 문자에서 f1 사용시 pos_label을 사용하라고 하셨습니다. 예측의 양성이 되는 문자를 구별하기 위함인데 그렇다면 이때도 roc_auc_score와 같이 pred값을 뽑아낼 때 pred[:,1]과 같이 양성 값만을 추출해야되는거 아닌가요?아니면 이 코드는 자동으로 양성값만을 예측하는 것인가요?
python머신러닝빅데이터pandas빅데이터분석기사

Answer 1

0

roadmap님의 프로필 이미지
roadmap
Instructor

이진분류 f1에 평가를 할 때 predict를 사용합니다. 이 결과는 예를 들면 0또는1, A 또는 B인 1개 컬럼이고

predict_proba와 같이 2개 컬럼이 아니에요 따라서 pred[:,1] 와 같이 2개 컬럼 중 하나를 선택하지 않아도 됩니다.

 

  1. f1_score 사용 시:

    • f1_score는 실제 레이블과 예측 레이블을 비교하여 계산됩니다. 이 때, pos_label 파라미터를 사용하여 어느 레이블을 양성으로 간주할지 지정합니다.

       

  2. roc_auc_score 사용 시:

    • roc_auc_score는 실제 레이블과 예측 확률 또는 점수를 비교하여 계산됩니다.

    • 이진 분류에서는 일반적으로 예측 확률의 두 번째 열(pred[:, 1])을 사용합니다. 이는 대부분의 이진 분류 모델에서 '1' 레이블(양성 클래스)에 대한 확률을 두 번째 열로 반환하기 때문입니다.

ash080886840님의 프로필 이미지
ash080886840
Questioner

아 감사합니다!!!

ash080886840's profile image
ash080886840

asked

Ask a question