• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

마지막 SMOTE 이후 LGBMClassifier 학습하고 평가할 때

21.03.02 12:00 작성 조회수 203

0

선생님~

SMOTE 방식으로 오버샘플링을 한 이후로는서

학습데이터의 레이블 데이터 값 분포가 균일 해져서 

boost_from_average=True로 하고 한번 해봤는데요~ 

(강의에서는 False로 그냥 진행되었었음)

재현율은 똑같고.. 정밀도는 조금 낮아졌지만,

ROC_AUC는 좀더 높아졌네요..

오버샘플링(혹은 언더샘플링)을 해서 

학습데이터의 레이블데이터의 값분포를 균일하게 맞춰주게 되면 

boost_from_average=True 로 하는 걸 더 권장하시나요~?

아니면 False로 하는 걸 더 권장하시나요..?

답변 1

답변을 작성해보세요.

1

안녕하십니까,

좋은 테스트를 해보셨군요.

극도로 불균일하지 않다면, 일반적으로는 boost_from_average=True 가 조금 더 성능이 좋을 수 있습니다. 그래서 Default로 True인것 같습니다.

freedom07님의 프로필

freedom07

질문자

2021.03.03

 답변 감사합니다 선생님^^