작업형2 모의문제 3

Question

영상 위치) 21:25 결과 예측 관련 질문입니다. 1) 랜덤포레스트랑 XGB로 평가한 후, 마지막에 예측은 XGB로 했는데 어떤 기준으로 XGB를 선택하는건가요?? 2) pred랑 pred_proba 중에 pred_proba를 사용한 이유가 있나요? pred_proba = xgb.predict_proba(test)

퇴근후딴짓 · Answer

검증데이터 평가 지표를 기준으로 판단합니다 🙂 시험에서 랜덤포레스트만 사용해도 40점에 문제없었어요 아래 ai 인턴도 잘 설명해줬는데 혹시 이해가 안된다면, 제가 새롭게 업로드한 "머신러닝 프로세스 New" 버전 마지막부분 시청 부탁드리겠습니다

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. ssjmj0404님, 질문 주신 부분에 대해 설명드리겠습니다. 여러 모델을 사용하여 예측을 진행할 때, 각각의 모델을 평가하고 최종적으로 어떤 모델의 결과를 사용할지 선택하는 것이 중요합니다. XGB 선택 기준 : 일반적으로 여러 모델을 사용하여 예측할 때는 각 모델의 성능을 평가하는 메트릭을 기준으로 선택합니다. 예를 들어, 회귀 모델에서는 R^2 값이나 Mean Squared Error (MSE) 를 사용할 수 있으며, 분류 모델에서는 Accuracy , Precision , Recall , F1-score , AUC-ROC 등의 지표를 사용합니다. 질문에서 &lsquo;마지막에 예측은 XGB로 했다&rsquo;고 하신 부분은 아마 이러한 평가 지표 중 XGB가 다른 모델보다 우수한 성능을 보여 선택된 것이 아닐까 합니다. pred 와 predict_proba 사용 이유 : predict_proba 메소드는 클래스에 속할 확률을 반환합니다. 예를 들어 이진 분류 문제에서는 [클래스 0의 확률, 클래스 1의 확률] 형태로 출력됩니다. 만약 이 확률 값을 사용하여 특정 기준(예: 0.5 이상일 때 클래스 1로 분류)을 적용하여 최종 결정을 내리고자 한다면 predict_proba 가 유용합니다. 반면 predict 는 데이터를 주어진 클래스 레이블로 바로 분류합니다. predict_proba 를 사용하는 이유는 각 분류에 대한 확률을 평가하거나 비율에 따라 가중치를 적용하는 등, 세부적인 조정을 가능하게 하기 때문일 것입니다. 혹시 관련 정보를 더 확인하시려면, 이곳 에서 유사한 내용을 다룬 답변을 참조하실 수 있습니다. 해당 게시글에서는 모델 선택과 predict_proba 의 사용에 대한 추가 설명을 제공합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.