정밀도와 재현율의 트레이드오프(Trade off) - 01
448
작성한 질문수 6
정밀도와 재현율은 Trade-off관계가 있다고 하였는데, confusion matrix에서 Positive로 예측할 확률이 높아지면 FP와 TP가 같은 비율로 증가하게 되고 결과적으로 임계치가 낮아져 Positive로 분류할 확률이 높아지더라도 정밀도는 동일한 것 같다고 생각이 됩니다. 제 생각에서 잘 못 된 것이 무엇인지 모르겠습니다. 재현율은 당연히 높아지는 데, 정밀도는 왜 감소하는지 이해되지 않습니다.
만약 Positive로 예측할 확률이 높아지는 경우에 FP와 TP가 같은 비율만큼 증가하는 것이 아니라면 반드시 FP증가율이 TP증가율보다 커져서 필연적으로 정밀도가 증가할 수 밖에 없는 것인지도 궁금하며, 이유도 궁금합니다.

답변 1
2
안녕하십니까,
좋은 질문이군요.
"confusion matrix에서 Positive로 예측할 확률이 높아지면 FP와 TP가 같은 비율로 증가하게 되고" 라고 하셨는데, "예측 임계치를 낮추면 confusion matrix에서 FP와 TP가 같은 비율로 증가하게 되고" 로 질문하신걸로 이해하고 답변 드리겠습니다(이런 의미가 아니면 다시 말씀해 주십시요)
예측 임계치를 낮추면 FP와 TP가 같은 비율로 증가하지 않습니다. 주로 FP가 크게 증가하게 됩니다. 특히 불균일한 데이터 세트(0이 대부분인 데이터)에서는 임계치를 낮춰버리면 기존 TN인 것들이 FP로 변경되는 경우들이 더 많게 됩니다. 아마 뒤에서 실습을 해보시면 아시겠지만, 예측 임계치를 낮춰보리면 TP 보다 FP가 더 증가하는 모습을 보시게 될 겁니다.
실습 강의를 해보시면 좀 더 이해에 도움이 될 것으로 생각됩니다. 아니면 다시 글 부탁드립니다.
감사합니다.
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
31
2
안녕하세요 열심히 수강중인 학생입니다
0
74
2
정수 인덱싱
0
77
2
넘파이 오류
0
98
2
11강 numpy의 axis 축 질문 드립니다.
0
93
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
85
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
74
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
79
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
67
2
5강 강의 오류가 있어요.
0
87
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
77
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
71
3
파이썬 다운그레이 후 사이킷런 재설치
0
124
2
좋은 강의 감사합니다.
0
76
2
scoring 함수 음수값
0
69
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
105
2
분류 평가 정확도 예측
0
83
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
105
1
카카오톡 채널 있나요
0
111
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
191
2
pca 스케일링 관련하여 질문드립니다.
0
106
2
주피터 대신 구글 코랩
0
177
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
149
2
실루엣 스코어..
0
88
2





