RandomForestClassifier 에 관련하여

Question

여러 가지 분석 모델이 존재하는데 (대표적으로 랜덤포레스트 그 외에도 xgboost, 디시젼트리, 로비스틱 회귀 등) 경우에 따라 다르겠지만 랜덤포레스트만 사용해도 될까요?(하이퍼파라미터 튜닝은 한다는 가정하에) 물론 여러 방법 해보면 정확도 높은 걸로 할 수 있어서 좋겠지만, 외우는게 부담인 것 같아서요 그리고 전처리 후에 라벨인코딩 vs 원핫인코딩 등 여러 방법이 있는데 어떤 상황에선 뭐로 하는게 좋다 이런 공식은 따로 없는 것일까요?

퇴근후딴짓 · Answer

네 딱 하나만 준비한다면 랜덤포레스트 추천하고, 두번짼 lightgbm 추천해요! 공식은 없습니다. 검증데이터를 가지고 평가한 후 결과 값을 보고 어떤 인코딩을 선택할지 결정합니다. 고성능을 요구하는 것은 아니니 이것도 하나로 밀고, 백업을 준비하는 걸로 하시는게 어떨까요?