인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

gkgktmd3196's profile image
gkgktmd3196

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Wisconsin Breast Cancer Prediction Using LightGBM

lgith gbm의 장점 질문

Resolved

Written on

·

389

1

lgbm의 장점중 카테고리형 피처의 자동 변환과 최적 분할(원 핫인코딩을 사용하지 않고도-)

라고 되어있는부분이 있습니다.

앞서 레이블 인코딩에 비해 원핫인코딩의 장점을 설명해주셨는데 만약 lgbm을 사용할 시에는

카테고리 피쳐를 굳이 원핫인코딩이 아닌 레이블 인코딩으로 변환하여 1칼럼으로 써도 크게 상관없다는 의미 일까요?

머신러닝 배워볼래요? 통계python

Answer 2

0

gkgktmd3196님의 프로필 이미지
gkgktmd3196
Questioner

그렇군요 감사합니다!

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

lgbm 뿐만 아니라 트리기반의 Ensemble경우 일반적으로 원핫 인코딩이 큰 성능향상은 없어보입니다.

원핫 인코딩이 좋을지 아닐지는 모델을 직접 구동해봐야 알지만, Decision Tree가 트리 분할이기 때문에 Label Encoding의 Label값의 크기에 영향이 크지 않기 때문에 그런것 같습니다.

감사합니다.

gkgktmd3196's profile image
gkgktmd3196

asked

Ask a question