강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2025) 🆕

랜포 회귀/분류구분

해결된 질문

작성

·

61

0

제2유형 랜포로 일관되게 풀건데요.

 

분류 : RandomForestClassifier

회귀 : RandomForestRegressor 구분을 어떻게 진행할까요?

 

문제에서

RSME 등과같은 오류율(- E로)끝나는 검증방법 제시하면 회귀로 풀면되고,

 

ROU-AUC / F1등 구분하는 경우 분류로 풀 예정입니다.

  • 추가적으로 ROU-AUC는 predic_proba 해줘야겠네요. ㅎㅎ

이렇게 구분하는게 맞을까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. 평가지표로 구분하는 방법 (잘 알고 계십니다 🙂 )

  2. 타겟을 보고 구분하는 방법 (연속형 숫자다 -> 회귀, 종류가 명확하게 구분된다 -> 분류)

  3. 문제를 읽고 구분하는 방법 (타겟이 매출액, 수량 등 숫자인지, 환자/정상 등 분류 인지 구분)

0

안녕하세요, 인프런 AI 인턴입니다. wlysh999님.

랜덤포레스트를 회귀와 분류 문제에서 어떻게 사용할지를 정하는 기준에 대해 질문해 주셨군요. 제시하신 기준은 상당히 합리적이며 일반적으로 사용하는 방법입니다. 간단히 정리해보면 다음과 같습니다:

  1. RandomForestRegressor (회귀 문제):

    • 평가지표로 RSME, MSE, MAE와 같은 오류율이 주어진다면 회귀 문제로 인식하는 것이 맞습니다. 이런 지표들은 연속형 변수의 예측 정확성을 평가할 때 사용됩니다.
  2. RandomForestClassifier (분류 문제):

    • 평가지표로 ROC-AUC, F1-score, Precision, Recall 등이 제공되면 이는 분류 문제입니다. 이 경우 목표는 데이터를 명확한 범주로 분류하는 것입니다.
  3. ROC-AUC에 대한 추가적인 설명:

    • ROC-AUC를 사용할 경우 predict_proba 메서드를 사용하여 각 클래스에 대한 확률을 계산하는 것이 필요합니다. 이는 모델이 예측 확률에 지속적으로 높은 점수를 매기기 때문에 분류의 민감도를 잘 평가할 수 있게 해 줍니다.

지표를 통한 구분은 문제의 본질과 예측하려는 결과와도 관련이 있으므로, 항상 구체적인 문제 설명을 주의 깊게 읽어주시는 것이 중요합니다.

관련 게시글도 참고하시면 더 깊이 있는 이해를 할 수 있으실 것입니다:
- 작업형2에서 언제는 분류모델을 써야하고 언제는 회귀모델을 써야할까요?!
- 작업형2 회귀문제인지, 분류문제인지 어떻게 판별하는 지 궁금합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

질문하기