-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
해결됨
lgith gbm의 장점 질문
20.07.05 14:54 작성 조회수 242
1
lgbm의 장점중 카테고리형 피처의 자동 변환과 최적 분할(원 핫인코딩을 사용하지 않고도-)
라고 되어있는부분이 있습니다.
앞서 레이블 인코딩에 비해 원핫인코딩의 장점을 설명해주셨는데 만약 lgbm을 사용할 시에는
카테고리 피쳐를 굳이 원핫인코딩이 아닌 레이블 인코딩으로 변환하여 1칼럼으로 써도 크게 상관없다는 의미 일까요?
답변을 작성해보세요.
0
0
권 철민
지식공유자2020.07.05
안녕하십니까,
lgbm 뿐만 아니라 트리기반의 Ensemble경우 일반적으로 원핫 인코딩이 큰 성능향상은 없어보입니다.
원핫 인코딩이 좋을지 아닐지는 모델을 직접 구동해봐야 알지만, Decision Tree가 트리 분할이기 때문에 Label Encoding의 Label값의 크기에 영향이 크지 않기 때문에 그런것 같습니다.
감사합니다.
답변 2