inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표 (이진/다중 분류, 회귀)

f1 score

해결된 질문

43

sujin3169

작성한 질문수 4

0

target 값이 문자형일 경우 양성 레이블을 설정해줘야 하는 평가지표는 f1 score 밖에 없는 건가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

그외 여러 평가지표가 있는데

외울 것 만 많아지는 것 같아 과감히 삭제하였습니다.

 

평가 지표는 자체 검증용이지 반드시 필요한 내용은 아니거든요!

모르는 평가 지표가 나왔다면 대안으로 알고 있는 평가 지표로 비교해도 좋습니다.

 

필기에서 공부하셨던 Precision 과 Recall 에서도 문자인 경우에는 어떤 것이 양성인지 체크가 필요합니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. sujin3169님.

문자형 타겟 값을 가진 데이터에서 양성 레이블, 즉 pos_label을 설정해줘야 하는 평가지표 관련해서 궁금해 하시는 것 같습니다. F1 스코어(F1 Score) 외에도, 동일한 상황에서 설정이 필요한 몇 가지 다른 평가지표가 있습니다. 이를 통해 분류 모델의 성능을 더욱 명확히 평가할 수 있습니다.

F1 Score와 기타 지표

  • F1 Score: 특히 불균형한 데이터셋에서 중요하며, 양성 클래스에만 초점을 맞추어 조화 평균을 계산합니다. 따라서 pos_label 설정이 필요합니다.

  • Precision and Recall: 이 지표들 또한 특정 클래스(양성 클래스) 기준으로 계산되기 때문에 pos_label 설정이 요구됩니다.

  • Accuracy: 일반적으로 두 클래스 간 비율을 비교하기 때문에 pos_label 설정은 필요 없습니다. 전체 예측의 정확성을 평가합니다.

  • AUC-ROC Curve: 연속적인 클래스 분류 문제에서 모델의 성능을 평가하는 데 사용되지만, 양성 클래스를 명시해야 하는 경우도 있습니다.

from sklearn.metrics import precision_score, recall_score

# F1, Precision, Recall 모두 pos_label 설정 필요
f1 = f1_score(y_true, y_pred, pos_label='positive_class')
precision = precision_score(y_true, y_pred, pos_label='positive_class')
recall = recall_score(y_true, y_pred, pos_label='positive_class')

print(f"F1 Score: {f1}, Precision: {precision}, Recall: {recall}")

유사한 질문 및 답변

아래와 같은 질문 링크들을 확인하시면 좀 더 심층적인 이해에 도움을 받을 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

대응표본검정 레빈

0

13

2

단일표본검정 문제 유형

0

16

2

[작업형 3] 6~7. 카이제곱 검정

0

15

2

9회 작업형3 문제 1-1

0

19

2

최종답안 계산 방식 질문

0

14

1

시험 치기 전 급하게 질문 사항

0

24

2

유형3

0

23

2

작업형 2 연습문제 섹션 3

0

17

2

11 기출문제 ipynb파일

0

21

2

작업형 3 유형

0

21

2

11회 기출 유형(작업형1) 2번 정답

0

18

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

16

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

21

2

28:19 roc_auc이유

0

20

2

수강연장문의

0

23

2

전체적인 머신러닝 순서

0

24

2

빅분기 실기 유형2질문

0

26

1

ID 전처리 이유

0

31

2

데이터제공

0

33

2

예시문제 작업형3 꼬리질문2번

0

22

1

데이터 개수를 구할 때, len과 value_counts 차이

0

28

2

작업형 2 제출방

0

22

2

인코딩 스케일링 순서

0

24

2