Written on
·
197
0
안녕하세요! 강의 너무 잘듣고 있습니다 ^^ Santander 예제를 가지고 LigthGBM Grid 서치하는 강의 중에 타겟율이 Imbalanced한 경우, mmlspark의 LightGBM의 성능은 떨어지는 경향을 보이고 있고 문제 제기 중이라고 말씀을 주셨는데요. mmlspark에서만 그런 이슈가 있는 것이고, 보통은 LightGBM이 XGB보다 성능이 잘나온다고 언급해주셨었습니다. 보통 LightGBM이 XGB보다 성능이 잘나오는 경우는 imbalanced data일 때를 한정하는 것인지 , 대부분의 Data에 모두 해당하는 것으로 의미하신 것인지, 궁금합니다. 감사합니다 !
Answer 1
0
안녕하십니까,
일반적으로 LightGBM은 XGBoost보다 성능이 비슷합니다. 다만 학습 시간이 훨씬 짧기 때문에 하이퍼 파라미터 최적화에 더 효율적입니다. 작은 데이터인 경우(20,000 건 이하 정도)는 성능이 상대적으로 떨어집니다.
개인적으로 사용해 보았을 때는 특정한 경우가 아닌, 많은 경우에 LightGBM이 전체적으로 성능이 살짝 더 좋았던것 같습니다.
감사합니다.