인프런 커뮤니티 질문&답변

김건우님의 프로필 이미지
김건우

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표 (이진/다중 분류, 회귀)

f1 스코어에 관련된 질문입니다.

해결된 질문

작성

·

262

0

이진분류 문자에서 f1 사용시 pos_label을 사용하라고 하셨습니다. 예측의 양성이 되는 문자를 구별하기 위함인데 그렇다면 이때도 roc_auc_score와 같이 pred값을 뽑아낼 때 pred[:,1]과 같이 양성 값만을 추출해야되는거 아닌가요?아니면 이 코드는 자동으로 양성값만을 예측하는 것인가요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

이진분류 f1에 평가를 할 때 predict를 사용합니다. 이 결과는 예를 들면 0또는1, A 또는 B인 1개 컬럼이고

predict_proba와 같이 2개 컬럼이 아니에요 따라서 pred[:,1] 와 같이 2개 컬럼 중 하나를 선택하지 않아도 됩니다.

 

  1. f1_score 사용 시:

    • f1_score는 실제 레이블과 예측 레이블을 비교하여 계산됩니다. 이 때, pos_label 파라미터를 사용하여 어느 레이블을 양성으로 간주할지 지정합니다.

       

  2. roc_auc_score 사용 시:

    • roc_auc_score는 실제 레이블과 예측 확률 또는 점수를 비교하여 계산됩니다.

    • 이진 분류에서는 일반적으로 예측 확률의 두 번째 열(pred[:, 1])을 사용합니다. 이는 대부분의 이진 분류 모델에서 '1' 레이블(양성 클래스)에 대한 확률을 두 번째 열로 반환하기 때문입니다.

김건우님의 프로필 이미지
김건우
질문자

아 감사합니다!!!

김건우님의 프로필 이미지
김건우

작성한 질문수

질문하기