마지막 SMOTE 이후 LGBMClassifier 학습하고 평가할 때

Question

[사진] 선생님~ SMOTE 방식으로 오버샘플링을 한 이후로는서 학습데이터의 레이블 데이터 값 분포가 균일 해져서 boost_from_average=True로 하고 한번 해봤는데요~ (강의에서는 False로 그냥 진행되었었음)  재현율은 똑같고.. 정밀도는 조금 낮아졌지만, ROC_AUC는 좀더 높아졌네요.. 오버샘플링(혹은 언더샘플링)을 해서 학습데이터의 레이블데이터의 값분포를 균일하게 맞춰주게 되면  boost_from_average=True 로 하는 걸 더 권장하시나요~? 아니면 False로 하는 걸 더 권장하시나요..?

Answer

안녕하십니까,

좋은 테스트를 해보셨군요.

극도로 불균일하지 않다면, 일반적으로는 boost_from_average=True 가 조금 더 성능이 좋을 수 있습니다. 그래서 Default로 True인것 같습니다.

freedom07

마지막 SMOTE 이후 LGBMClassifier 학습하고 평가할 때

이 글과 비슷한 Q&A

7회 기출문제 원핫인코딩 관련 질문입니다.

MYSQL 맥북 오류

동적 페이지 이동 크롤링 방법 문의

섹션 테스트 코드 오류..