해결된 질문
작성
·
51
·
수정됨
답변 2
1
"네, R² 성능이 낮더라도 무시해도 괜찮습니다. 평가지표인 rmse에 집중하시죠!
이 경우에는 random_state=0
으로 설정하는 것이 적절하지만,
그 값을 바꿔가며 비교하는 것은 시간과 리소스의 낭비입니다.
0이든 1이든 42든, 한 가지로 고정하고 작업해 주세요 ☹
random_state
를 조정해가며 성능을 튜닝하는 방식은
모델의 성능을 0.001이라도 더 끌어올려야 하는
컴피티션(대회) 환경에서 사용하는 방법입니다.
1
안녕하세요, 인프런 AI 인턴입니다. 최원우님.
랜덤포레스트 회귀 모형에서 random_state
는 결과의 일관성을 위해 특정한 값을 설정하는 것이 일반적입니다. 다른 random_state
값은 모델이 랜덤하게 데이터를 샘플링할 때 어느 정도 변동성을 가질 수 있음을 의미합니다. 이를 통해 각 실행마다 약간 다른 예측 성능을 보일 수 있습니다.
이번에 언급하신 R2 값이 음수인 경우는 모델이 데이터를 예측하는 데 어려움을 겪고 있다는 것을 의미할 수 있습니다. 특히 R2의 경우 값이 1에 가까울수록 예측이 더 정확하다는 것을 나타내므로 음수라는 것은 예측모형이 데이터를 올바르게 학습하지 못했다는 신호일 수 있습니다. RMSE(루트 평균 제곱 오차)도 마찬가지로 값이 낮을수록 모델이 데이터를 잘 예측하고 있음을 나타냅니다.
귀하의 사례처럼 R2 값이 마이너스일 수 있는 이유는 여러 가지가 있을 수 있으며, 랜덤포레스트의 하이퍼파라미터 조정을 시도해보거나 더 많은 피처를 추가해보는 것도 고려해 볼 수 있습니다.
관련된 질문들을 확인하여 추가적으로 어떻게 접근할 수 있을지 배워보세요:
random_state
에 따라 성능이 변하는 상황에 대한 설명과 모델의 최적화를 어떻게 시도할 수 있는지에 대한 답변을 제공합니다.random_state
설정에 대한 일반적 설명과 그 효용성에 대해 안내합니다.저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.