작성
·
292
0
선생님~
SMOTE 방식으로 오버샘플링을 한 이후로는서
학습데이터의 레이블 데이터 값 분포가 균일 해져서
boost_from_average=True로 하고 한번 해봤는데요~
(강의에서는 False로 그냥 진행되었었음)
재현율은 똑같고.. 정밀도는 조금 낮아졌지만,
ROC_AUC는 좀더 높아졌네요..
오버샘플링(혹은 언더샘플링)을 해서
학습데이터의 레이블데이터의 값분포를 균일하게 맞춰주게 되면
boost_from_average=True 로 하는 걸 더 권장하시나요~?
아니면 False로 하는 걸 더 권장하시나요..?
답변 1
1
안녕하십니까,
좋은 테스트를 해보셨군요.
극도로 불균일하지 않다면, 일반적으로는 boost_from_average=True 가 조금 더 성능이 좋을 수 있습니다. 그래서 Default로 True인것 같습니다.
답변 감사합니다 선생님^^