• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

lgith gbm의 장점 질문

20.07.05 14:54 작성 조회수 242

1

lgbm의 장점중 카테고리형 피처의 자동 변환과 최적 분할(원 핫인코딩을 사용하지 않고도-)

라고 되어있는부분이 있습니다.

앞서 레이블 인코딩에 비해 원핫인코딩의 장점을 설명해주셨는데 만약 lgbm을 사용할 시에는

카테고리 피쳐를 굳이 원핫인코딩이 아닌 레이블 인코딩으로 변환하여 1칼럼으로 써도 크게 상관없다는 의미 일까요?

답변 2

·

답변을 작성해보세요.

0

gkgktmd님의 프로필

gkgktmd

질문자

2020.07.06

그렇군요 감사합니다!

0

안녕하십니까,

lgbm 뿐만 아니라 트리기반의 Ensemble경우 일반적으로 원핫 인코딩이 큰 성능향상은 없어보입니다.

원핫 인코딩이 좋을지 아닐지는 모델을 직접 구동해봐야 알지만, Decision Tree가 트리 분할이기 때문에 Label Encoding의 Label값의 크기에 영향이 크지 않기 때문에 그런것 같습니다.

감사합니다.