RandomForestClassifier 에 관련하여
여러 가지 분석 모델이 존재하는데
(대표적으로 랜덤포레스트 그 외에도 xgboost, 디시젼트리, 로비스틱 회귀 등)
경우에 따라 다르겠지만 랜덤포레스트만 사용해도 될까요?(하이퍼파라미터 튜닝은 한다는 가정하에)
물론 여러 방법 해보면 정확도 높은 걸로 할 수 있어서 좋겠지만, 외우는게 부담인 것 같아서요
그리고 전처리 후에 라벨인코딩 vs 원핫인코딩 등 여러 방법이 있는데
어떤 상황에선 뭐로 하는게 좋다 이런 공식은 따로 없는 것일까요?
답변 1
0
네 딱 하나만 준비한다면 랜덤포레스트 추천하고, 두번짼 lightgbm 추천해요!
공식은 없습니다. 검증데이터를 가지고 평가한 후 결과 값을 보고 어떤 인코딩을 선택할지 결정합니다.
고성능을 요구하는 것은 아니니 이것도 하나로 밀고, 백업을 준비하는 걸로 하시는게 어떨까요?
작업형3 기출
0
6
1
유형2에서 데이터분할 생략 가능여부
0
7
1
9회 기출 유형3 질문
0
7
1
lgb 기초편
0
5
1
괄호 사용
0
8
1
작업형 2 데이터 전처리 질문
0
9
0
11회 기출 유형 작업형1 문제 3-1
0
8
0
예시문제 작업형2 (ver2023) 질문입니다
0
10
1
Data type에 따른 처리
0
6
1
데이터 전처리 관련
0
13
2
시험에서 문제 불러오기
0
12
2
2번문제 출력값 질문
0
17
2
pd.get_dummies()가 bool로 반환
0
16
2
대응표본검정 레빈
0
20
3
단일표본검정 문제 유형
0
20
2
[작업형 3] 6~7. 카이제곱 검정
0
16
2
9회 작업형3 문제 1-1
0
32
2
최종답안 계산 방식 질문
0
19
1
시험 치기 전 급하게 질문 사항
0
34
2
유형3
0
29
2
작업형 2 연습문제 섹션 3
0
20
2
11 기출문제 ipynb파일
0
32
2
작업형 3 유형
0
27
2
11회 기출 유형(작업형1) 2번 정답
0
28
2





