inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

캐글 Advanced 머신러닝 실전 박치기

강의 설명 자료 및 실습 코드 다운로드 받기

feature가 재현율에 미치는 영향을 나타내는 지표

210

Sekeun Oh

작성한 질문수 1

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
안녕하세요 선생님, 항상 좋은 강의 해주셔서 감사합니다.
다름이아니라, 분류모델링 중 불균형이 심한 데이터 (0이 95% 이상, 1이 5% 남짓)를 처리하는 모델링을 현업에서 진행중인데,
컬럼의 수도 매우 많은 편이라 feature engineering 중 어려움을 겪고 있습니다.
재현율이 핵심인 모델인데,
 
feature가 재현율에 미치는 영향을 알려주는 지표나 guideline같은 것이 있을까요?
 
없다면 재현율의 저하를 야기하는 feature의 특징을 알 수 있을까요??
 
항상 감사합니다!

kaggle 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까, 

feature가 특정 지표만, 가령 재현율만 영향을 미치는 것을 알려주는 지표는 없습니다.

재현율을 향상 시키는게 목표라면, SMOTE로 오버샘플링을 해보시는건 어떨지요? 다만 오버 샘플링을 하면 재현율은 좋아지지만 정밀도는 상대적으로 낮아질 수 있습니다. 

감사합니다.  

0

Sekeun Oh

 

feature selection과 smote로 해결했습니다! 항상 감사합니다 :)

sql사용

0

58

2

좋은 강의 감사드립니다.

0

82

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

261

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

621

1

안녕하세요 선생님

0

238

1

권철민교수님 진심으로 감사드립니다.

0

321

1

안녕하세요 선생님

0

358

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

273

1

초거대 데이터셋을 Submission하려면?

0

194

1

Library 관련 질문

0

356

3

최적화 함수 에러

0

597

4

LightGBM Iteration관련

0

432

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

208

1

코드를 실행했는데 오류가 발생합니다

0

2000

2

bayes_opt 회귀 모델에 적용하려면..

0

270

1

타겟값의 로그변환에 대해서

0

786

1

아나콘다 환경설정

0

464

1

깃허브 주소 문의드립니다.

0

363

1

손실함수에 대한 질문

0

351

1

card_bal 데이터셋 시각화 관련 질문입니다

0

237

1

LGBM null값 처리에 관해 질문있습니다

0

545

1

컬럼 관련 질문

0

282

1

히스토그램 x 값

0

368

1

n_iter 횟수 넘음 질문

0

498

2