inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표 (이진/다중 분류, 회귀)

f1 스코어에 관련된 질문입니다.

해결된 질문

313

김건우

작성한 질문수 12

0

이진분류 문자에서 f1 사용시 pos_label을 사용하라고 하셨습니다. 예측의 양성이 되는 문자를 구별하기 위함인데 그렇다면 이때도 roc_auc_score와 같이 pred값을 뽑아낼 때 pred[:,1]과 같이 양성 값만을 추출해야되는거 아닌가요?아니면 이 코드는 자동으로 양성값만을 예측하는 것인가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

이진분류 f1에 평가를 할 때 predict를 사용합니다. 이 결과는 예를 들면 0또는1, A 또는 B인 1개 컬럼이고

predict_proba와 같이 2개 컬럼이 아니에요 따라서 pred[:,1] 와 같이 2개 컬럼 중 하나를 선택하지 않아도 됩니다.

 

  1. f1_score 사용 시:

    • f1_score는 실제 레이블과 예측 레이블을 비교하여 계산됩니다. 이 때, pos_label 파라미터를 사용하여 어느 레이블을 양성으로 간주할지 지정합니다.

       

  2. roc_auc_score 사용 시:

    • roc_auc_score는 실제 레이블과 예측 확률 또는 점수를 비교하여 계산됩니다.

    • 이진 분류에서는 일반적으로 예측 확률의 두 번째 열(pred[:, 1])을 사용합니다. 이는 대부분의 이진 분류 모델에서 '1' 레이블(양성 클래스)에 대한 확률을 두 번째 열로 반환하기 때문입니다.

0

김건우

아 감사합니다!!!

작업형2 모의문제1 (30강)

0

18

1

수강 기간 연장 문의 드립니다.

0

21

1

수강 계획과 관련해 문의 드립니다.

0

19

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

44

2

작업형 1 -연습문제 4-6

0

32

2

작업형 1 유형 부분

0

40

2

작업형 1 (삭제예정, 구 버전)

0

50

2

수강기간 연장 문의드립니다.

0

35

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

38

1

인덱스 슬라이싱

0

35

2

질문 드립니다.

0

49

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

47

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

62

2

강의 기간 연장 가능여부 검토 요청건

0

49

2

수강기간 연장 문의 드립니다

0

45

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2

문제 3-2 질문드립니다

0

47

2