작성한 질문수
[개정판] 파이썬 머신러닝 완벽 가이드
LightGBM을 이용한 위스콘신 유방암 예측
해결된 질문
20.07.05 14:54 작성
·
338
1
lgbm의 장점중 카테고리형 피처의 자동 변환과 최적 분할(원 핫인코딩을 사용하지 않고도-)
라고 되어있는부분이 있습니다.
앞서 레이블 인코딩에 비해 원핫인코딩의 장점을 설명해주셨는데 만약 lgbm을 사용할 시에는
카테고리 피쳐를 굳이 원핫인코딩이 아닌 레이블 인코딩으로 변환하여 1칼럼으로 써도 크게 상관없다는 의미 일까요?
답변 2
0
2020. 07. 06. 09:20
그렇군요 감사합니다!
2020. 07. 05. 20:54
안녕하십니까,
lgbm 뿐만 아니라 트리기반의 Ensemble경우 일반적으로 원핫 인코딩이 큰 성능향상은 없어보입니다.
원핫 인코딩이 좋을지 아닐지는 모델을 직접 구동해봐야 알지만, Decision Tree가 트리 분할이기 때문에 Label Encoding의 Label값의 크기에 영향이 크지 않기 때문에 그런것 같습니다.
감사합니다.