머신러닝 학습 및 평가
랜덤포레스트, lightgbm 이거 둘 중에 급하면,, 랜덤포레스트만 사용해도 괜찮을까요?
둘 중에 하나만 사용한다면 더 좋은게 있는건가요?
정석대로 한다면, 둘다 진행해서 값이 error일때는 작은걸로 사용하면 되는건가요?
단순한 질문 같은데 아직 감이 잡힐듯말듯해서 질문드립니다..ㅠ
감사합니다
답변 2
0
안녕하세요, 인프런 AI 인턴입니다. 합격님.
랜덤포레스트(Random Forest)와 LightGBM은 둘 다 머신러닝에서 널리 사용되는 강력한 알고리즘입니다. 두 알고리즘 모두 각각의 장단점을 가지고 있으며, 특정 상황에 따라서 더 적합한 것을 선택해야 합니다. 아래에 간단히 요약해 보았습니다:
RandomForest:
- 장점: 직관적이고 사용이 간편하며, 크고 다양한 데이터셋에 대해 강력한 성능을 발휘합니다.
- 단점: 학습 시간이 길어질 수 있으며, 복잡한 모델로 인해 해석성이 떨어질 수 있습니다.
- 장점: 직관적이고 사용이 간편하며, 크고 다양한 데이터셋에 대해 강력한 성능을 발휘합니다.
LightGBM:
- 장점: 학습과 예측이 빠르고, 대용량 데이터셋에서도 효과적으로 동작합니다. 또한 범주형 변수를 자동으로 처리할 수 있어 코드가 간단해집니다.
- 단점: 하이퍼파라미터 최적화가 필요할 수 있으며, 초기 설정이 까다로울 수 있습니다.
- 장점: 학습과 예측이 빠르고, 대용량 데이터셋에서도 효과적으로 동작합니다. 또한 범주형 변수를 자동으로 처리할 수 있어 코드가 간단해집니다.
둘 중 하나만 사용할 경우:
- RandomForest는 안정적이고 여러 상황에서 기본적으로 잘 활용될 수 있습니다.
- LightGBM은 대용량 데이터나 빠른 성능이 필요한 경우 적합합니다.
- RandomForest는 안정적이고 여러 상황에서 기본적으로 잘 활용될 수 있습니다.
모델 선택 전략:
- 정석적인 방법으로는 두 모델 모두 시도해보고, 성능이 더 우수한 모델을 선택하는 것입니다. 예를 들어, 오류(error)가 클수록 좋은 성능을 제공하는 모델을 선택하는 것이 좋습니다.
- 정석적인 방법으로는 두 모델 모두 시도해보고, 성능이 더 우수한 모델을 선택하는 것입니다. 예를 들어, 오류(error)가 클수록 좋은 성능을 제공하는 모델을 선택하는 것이 좋습니다.
아래의 링크에서 관련 논의를 통해 추가 정보를 확인할 수 있습니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
RandomForest vs lgb
0
2
1
전처리 관련질문
0
6
2
작업형3 기출
0
6
1
유형2에서 데이터분할 생략 가능여부
0
8
1
9회 기출 유형3 질문
0
8
1
lgb 기초편
0
5
1
괄호 사용
0
9
1
작업형 2 데이터 전처리 질문
0
10
0
11회 기출 유형 작업형1 문제 3-1
0
9
0
예시문제 작업형2 (ver2023) 질문입니다
0
11
1
Data type에 따른 처리
0
8
1
데이터 전처리 관련
0
14
2
시험에서 문제 불러오기
0
12
2
2번문제 출력값 질문
0
17
2
pd.get_dummies()가 bool로 반환
0
16
2
대응표본검정 레빈
0
20
3
단일표본검정 문제 유형
0
22
2
[작업형 3] 6~7. 카이제곱 검정
0
18
2
9회 작업형3 문제 1-1
0
32
2
최종답안 계산 방식 질문
0
19
1
시험 치기 전 급하게 질문 사항
0
34
2
유형3
0
29
2
작업형 2 연습문제 섹션 3
0
20
2
11 기출문제 ipynb파일
0
33
2





