평가지표 F1 스코어 질문드립니다.
안녕하세요!
F1 스코어 설명하시면서
average = micro, macro, weighted
중에 문제에서 요구하는데로 쓰면 된다고 하셨는데..
만약 문제에서 제시된 평가지표가 F1 스코어가 아니지만 F1 스코어를 사용하려고 할 경우(문제에서 요구된게 없는 경우)에는 micro, macro, weighted 중 어떤걸 사용하면 될까요?
감사합니다.
回答 2
0
평기 기준은 명확하게 출제 됩니다.
F1 스코어만 요청했다면 이진 분류이고, F1 스코어만 사용하면 됩니다.
추가 옵션이 있는 경우 다중 분류이고 F1 스코어에서 제시된 옵션값을 추가하면됩니다.
단, 평가 기준은 실제 채점과는 관련이 없습니다.
자체적으로 검증데이터로 자가 평가하는 용도입니다. (모의시험)
0
안녕하세요, 인프런 AI 인턴입니다. 한광욱님!
F1 스코어를 계산할 때 average 파라미터는 다중 클래스(targets가 여러 범주를 가지는) 문제에 대한 평가 방법을 지정합니다. 여기서 각 옵션들은 각각 다른 맥락에서 사용됩니다:
micro: 전체 데이터를 대상으로 한 전반적인 평가를 의미합니다. 모든 개별 클래스를 고려하지 않고 전체 true positive, false negative, false positive를 토대로 평가하기 때문에 각 클래스를 동등하게 고려하지 못할 수 있습니다. 다중 클래스에서 여러 정보를 통합하여 단일 평가를 얻을 때 사용됩니다.macro: 각 클래스를 개별적으로 평가하고 평균을 내는 방식입니다. 모든 클래스에 동일한 가중치를 부여하기 때문에 특정 클래스에 데이터가 편중되는 경우 더 공정하게 평가할 수 있습니다. 다중 클래스 문제에서 각 클래스 간의 차이를 자세히 보고 싶을 때 사용합니다.weighted: 각 클래스의 크기에 비례하여 가중평균을 계산합니다. 데이터 비중이 큰 클래스일수록 더 큰 영향을 받기 때문에, 클래스 간 불균형 문제를 보완할 수 있습니다.
문제에서 특별히 요구하지 않는 경우, 데이터의 특성과 평가 목적에 따라 어떤 average 설정을 사용할지를 결정하는 것이 좋습니다. 일반적으로 데이터가 균형 잡힌 다중 클래스 문제에서는 macro가 자주 사용되며, 특정 클래스에 데이터가 많이 편중되어 있으면 weighted를 사용하여 평형을 맞추는 것이 좋습니다.
아래 기존의 유사한 질문 및 답변이 한광욱님의 상황에 도움이 될 수 있습니다:
- 4회 기출-2유형 macro-f1 score 관련: different
average옵션이 있을 때의 사용법에 대한 설명이 잘 나와 있습니다.
- 오늘시험 작업형2 f1 score 관련 질문드려요: 각
average옵션 사용 시 특수한 주의점을 설명하고 있는 가이드가 도움될 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형 2 기출7회분에서
0
21
2
작업형2 모의문제1 (30강)
0
24
2
수강 기간 연장 문의 드립니다.
0
29
2
수강 계획과 관련해 문의 드립니다.
0
24
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
48
2
작업형 1 -연습문제 4-6
0
34
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
37
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
36
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
48
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
63
2
강의 기간 연장 가능여부 검토 요청건
0
51
2
수강기간 연장 문의 드립니다
0
46
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
57
2
수강기간 연장 문의드립니다.
0
60
2

