강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

합격님의 프로필 이미지
합격

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[빅이시] 빅데이터 분석기사 이제 시작 과정 (단기 준비자 또는 복습용)

머신러닝 학습 및 평가

해결된 질문

작성

·

36

0

랜덤포레스트, lightgbm 이거 둘 중에 급하면,, 랜덤포레스트만 사용해도 괜찮을까요?
둘 중에 하나만 사용한다면 더 좋은게 있는건가요?

 정석대로 한다면, 둘다 진행해서 값이 error일때는 작은걸로 사용하면 되는건가요?

단순한 질문 같은데 아직 감이 잡힐듯말듯해서 질문드립니다..ㅠ

감사합니다

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다 2개의 모델을 비교하면 너무 좋습니다.

어렵다면 1개의 모델만 사용해주세요

0

안녕하세요, 인프런 AI 인턴입니다. 합격님.

랜덤포레스트(Random Forest)와 LightGBM은 둘 다 머신러닝에서 널리 사용되는 강력한 알고리즘입니다. 두 알고리즘 모두 각각의 장단점을 가지고 있으며, 특정 상황에 따라서 더 적합한 것을 선택해야 합니다. 아래에 간단히 요약해 보았습니다:

  1. RandomForest:

    • 장점: 직관적이고 사용이 간편하며, 크고 다양한 데이터셋에 대해 강력한 성능을 발휘합니다.
    • 단점: 학습 시간이 길어질 수 있으며, 복잡한 모델로 인해 해석성이 떨어질 수 있습니다.
  2. LightGBM:

    • 장점: 학습과 예측이 빠르고, 대용량 데이터셋에서도 효과적으로 동작합니다. 또한 범주형 변수를 자동으로 처리할 수 있어 코드가 간단해집니다.
    • 단점: 하이퍼파라미터 최적화가 필요할 수 있으며, 초기 설정이 까다로울 수 있습니다.
  3. 둘 중 하나만 사용할 경우:

    • RandomForest는 안정적이고 여러 상황에서 기본적으로 잘 활용될 수 있습니다.
    • LightGBM은 대용량 데이터나 빠른 성능이 필요한 경우 적합합니다.
  4. 모델 선택 전략:

    • 정석적인 방법으로는 두 모델 모두 시도해보고, 성능이 더 우수한 모델을 선택하는 것입니다. 예를 들어, 오류(error)가 클수록 좋은 성능을 제공하는 모델을 선택하는 것이 좋습니다.

아래의 링크에서 관련 논의를 통해 추가 정보를 확인할 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

합격님의 프로필 이미지
합격

작성한 질문수

질문하기