• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

feature가 재현율에 미치는 영향을 나타내는 지표

21.11.24 15:11 작성 조회수 94

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
안녕하세요 선생님, 항상 좋은 강의 해주셔서 감사합니다.
다름이아니라, 분류모델링 중 불균형이 심한 데이터 (0이 95% 이상, 1이 5% 남짓)를 처리하는 모델링을 현업에서 진행중인데,
컬럼의 수도 매우 많은 편이라 feature engineering 중 어려움을 겪고 있습니다.
재현율이 핵심인 모델인데,
 
feature가 재현율에 미치는 영향을 알려주는 지표나 guideline같은 것이 있을까요?
 
없다면 재현율의 저하를 야기하는 feature의 특징을 알 수 있을까요??
 
항상 감사합니다!

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

feature가 특정 지표만, 가령 재현율만 영향을 미치는 것을 알려주는 지표는 없습니다.

재현율을 향상 시키는게 목표라면, SMOTE로 오버샘플링을 해보시는건 어떨지요? 다만 오버 샘플링을 하면 재현율은 좋아지지만 정밀도는 상대적으로 낮아질 수 있습니다. 

감사합니다.  

Sekeun Oh님의 프로필

Sekeun Oh

질문자

2021.11.26

 

feature selection과 smote로 해결했습니다! 항상 감사합니다 :)