인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

freedom07님의 프로필 이미지
freedom07

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

분류 실습 2: 신용카드 사기 예측 실습 - 03

마지막 SMOTE 이후 LGBMClassifier 학습하고 평가할 때

작성

·

292

0

선생님~

SMOTE 방식으로 오버샘플링을 한 이후로는서

학습데이터의 레이블 데이터 값 분포가 균일 해져서 

boost_from_average=True로 하고 한번 해봤는데요~ 

(강의에서는 False로 그냥 진행되었었음)

재현율은 똑같고.. 정밀도는 조금 낮아졌지만,

ROC_AUC는 좀더 높아졌네요..

오버샘플링(혹은 언더샘플링)을 해서 

학습데이터의 레이블데이터의 값분포를 균일하게 맞춰주게 되면 

boost_from_average=True 로 하는 걸 더 권장하시나요~?

아니면 False로 하는 걸 더 권장하시나요..?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

좋은 테스트를 해보셨군요.

극도로 불균일하지 않다면, 일반적으로는 boost_from_average=True 가 조금 더 성능이 좋을 수 있습니다. 그래서 Default로 True인것 같습니다.

freedom07님의 프로필 이미지
freedom07
질문자

 답변 감사합니다 선생님^^

freedom07님의 프로필 이미지
freedom07

작성한 질문수

질문하기