• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

F1 스코어

22.06.19 17:21 작성 조회수 483

0

책 166 ~167 쪽에 F1 스코어는 정밀도와 재현율이 어느 한쪽으로 치우치지 않는 수치를 나타낼 때 상대적을 높은 값을 가진다고 써있는데 167쪽에 분류 결정 임곗값 표를보면 0.6일 때 왜 더 좋은 성능 지표를 보여주는지 모르겠습니다 

어느 한쪽으로 치우치지 않는 수치를 가질 때 더 좋은 값을 가진다면 분류 결정 임곗값이 0.45일 때 제일 좋은 값을 보여줘야 하는거 아닌가요?

그리고 임곗값이 0.6일 때가 임곗값 0.4~ 0.6 중에 제일 좋은 성능지표라고 말할 수 있는건가요?

답변 2

·

답변을 작성해보세요.

0

너무 심각하게 생각하지 않으셨으면 합니다. 

f1 score는 f1 score의 식이 있는 것이고 해당 식은 재현율과 정밀도의 간격이 너무 크면 수치가 좋지 않게 계산이 됩니다. 이걸 재현율, 정밀도가 얼마나 비슷하고 다른가에 따라 얼마나 f1 수치가 달라지고 여기에 너무 집중하실 필요가 없다고 봅니다. 

성능 지표란 다양하게 보면 좋습니다. 정밀도도 보고, 재현율도 보고, f1 score도 보십시요. 그리고 뒤에서 애기할 ROC-AUC 도 함께 보십시요.

f1 score를 보는 이유는 정밀도 또는 재현율이 양극단에 있을 때 한쪽 수치만을 평가 지표로 하면 안되기 때문에 존재하는 것입니다. 어떤 지표가 절대적으로 모든 상황에서 우수한 상황같은건 없습니다. 

예찬님의 프로필

예찬

질문자

2022.06.21

넵 감사합니다 !

0

1. f1 score는 precision 또는 recall중 한쪽이 크게 치우치면 수치가 떨어지지만, 그 떨어지는 수치의 정도는 precision, recall 값에 따라 다를 수 있습니다. 

직접 F1 Score 식에 계산을 해보시면 나올 수 있을 것 같습니다. 

2* precision * recall / (precision + recall) 로 구해 보시면 됩니다. 

2. 그리고 임곗값이 0.6일 때가 임곗값 0.4~ 0.6 중에 제일 좋은 성능지표라고 말할 수 있는건가요?

=> 책/강의에서도 말씀 드렸듯이 0.6 일때 f1 score가 가장 좋지만, recall은 다른 임계값일 때가 더 좋습니다. 모델을 어떤 성능 지표로 평가하느냐에 따라 다를 수 있습니다. 

 

 

예찬님의 프로필

예찬

질문자

2022.06.20

그럼 임곗값에 따른 정밀도와 재현율을 직접 확인하며 비교하는 것이 더 정확한 지표 아닌가요? 굳이 F1 스코어를 쓰는 이유가 뭔가요?

그럼 임곗값에 따른 정밀도와 재현율을 직접 확인하며 비교하는 것이 더 정확한 지표 아닌가요?

=> 왜 그런 생각을 하셨는지 잘 모르겠습니다만, f1 score는 실무에서 많이 활용되는 지표입니다.  

f1 score는 정밀도 또는 재현율이 양극단이 되면 수치값이 좋지 않습니다. 그렇다고 둘다 비슷하다고 반드시 높지 않습니다. 

정밀도, 재현율이 각각 0.5 이면 정밀도가 0.6, 재현율이 0.4 일때 보다 f1 score가 높지만 정밀도가 0.6, 재현율이 0.45일 경우 보다는 낮습니다. 

 

 

예찬님의 프로필

예찬

질문자

2022.06.20

정밀도와 재현율이 서로 같이 높아야 좋은 성능지표 아닌가요?  f1스코어는 정밀도와 재현율이 서로 얼마나 잘 조화롭게 있는지 확인하기 위한 수치가 아닌가요? 임곗값에 따라 정밀도와 재현율을 확인하는 예제에서 처럼 임곗값에 따른 정밀도와 재현율의 성능을 직접 확인하는 것이 f1스코어로 확인하는것보다 더 좋은 지표가 아닐까해서요 제가 이해를 잘 못하고 있는거같은데 어느부분이 그런건지 모르겠습니다 ㅠㅠ 그리도 또 정밀도와 재현율이 서로 비슷하다고 해서 f1스코어의 값이 높지 않는다고 말씀 하셨는데 그렇다면 정밀도와 재현율이 서로 얼마나 값이 비슷한지보다 f1스코어의 값이 더 중요한가요?