-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
마지막 SMOTE 이후 LGBMClassifier 학습하고 평가할 때
21.03.02 12:00 작성 조회수 203
0
선생님~
SMOTE 방식으로 오버샘플링을 한 이후로는서
학습데이터의 레이블 데이터 값 분포가 균일 해져서
boost_from_average=True로 하고 한번 해봤는데요~
(강의에서는 False로 그냥 진행되었었음)
재현율은 똑같고.. 정밀도는 조금 낮아졌지만,
ROC_AUC는 좀더 높아졌네요..
오버샘플링(혹은 언더샘플링)을 해서
학습데이터의 레이블데이터의 값분포를 균일하게 맞춰주게 되면
boost_from_average=True 로 하는 걸 더 권장하시나요~?
아니면 False로 하는 걸 더 권장하시나요..?
답변을 작성해보세요.
1
권 철민
지식공유자2021.03.02
안녕하십니까,
좋은 테스트를 해보셨군요.
극도로 불균일하지 않다면, 일반적으로는 boost_from_average=True 가 조금 더 성능이 좋을 수 있습니다. 그래서 Default로 True인것 같습니다.
답변 1