LightGBM 관련 질문
225
작성한 질문수 1
안녕하세요! 강의 너무 잘듣고 있습니다 ^^ Santander 예제를 가지고 LigthGBM Grid 서치하는 강의 중에 타겟율이 Imbalanced한 경우, mmlspark의 LightGBM의 성능은 떨어지는 경향을 보이고 있고 문제 제기 중이라고 말씀을 주셨는데요. mmlspark에서만 그런 이슈가 있는 것이고, 보통은 LightGBM이 XGB보다 성능이 잘나온다고 언급해주셨었습니다. 보통 LightGBM이 XGB보다 성능이 잘나오는 경우는 imbalanced data일 때를 한정하는 것인지 , 대부분의 Data에 모두 해당하는 것으로 의미하신 것인지, 궁금합니다. 감사합니다 !
답변 1
0
안녕하십니까,
일반적으로 LightGBM은 XGBoost보다 성능이 비슷합니다. 다만 학습 시간이 훨씬 짧기 때문에 하이퍼 파라미터 최적화에 더 효율적입니다. 작은 데이터인 경우(20,000 건 이하 정도)는 성능이 상대적으로 떨어집니다.
개인적으로 사용해 보았을 때는 특정한 경우가 아닌, 많은 경우에 LightGBM이 전체적으로 성능이 살짝 더 좋았던것 같습니다.
감사합니다.
강사님 안녕하세요 ㅎdatabricks환경에 대한 설
0
63
3
데이터 브릭스 이슈
0
111
2
데이터 브릭스 가입
0
98
2
pyspark local 설치
0
101
2
community edition 가입 문의
0
113
2
데이터 로드 및 로딩 된 파일 데이터 목록 조회 방
0
171
2
클러스터 버전 설정
0
136
3
instacart market basket analysis
0
189
3
spark 추가 학습 관련 질문
0
235
2
MLOps 관련 MLFLow 및 Databricks 모델 서빙
0
404
1
train파일 업로드 중에 해당 경로가 없다고 뜹니다
0
376
2
강의가 재생되지 않음
0
266
2
후속 강의 계획 질문드립니다.
0
374
1
spark_xgboost_lightgbm 강의부분 관련
0
476
1
spark환경에서 데이터 수정에 관하여 질문이 있습니다.
1
327
1
Spark를 이용하여 binary file -> parquet, csv 변환 가능여부
0
574
1
SPARK 2 강의 오픈
0
499
1
Spark ML 모델 서빙
0
571
1
mac os ) zip 파일 dataframe 오류
0
674
1
ModuleNotFoundError : No module named 'mmlspark' - 20230218
0
631
1
TrainValidationSplit과 randomSplit 사용 질문
0
403
1
현업에서는 scala-spark를 사용하나요? py-spark를 사용하나요?
0
519
1
cluster 생성 Database runtime version 질문
0
277
1
Pandas vs Spark: 비용, 처리시간 비교
0
1241
1





