강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

최원우님의 프로필 이미지
최원우

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

7회 기출유형(작업형2)

기출7회-작업형2에서 random_state = 0 과 42 차이에 대한 질문

해결된 질문

작성

·

51

·

수정됨

0

7회기출 풀면서,랜덤포레스트회귀로 풀었는데. R2값이 마이너스라고 놀랐고. 아래는 random_state 설정별 결과값인데, 0이 더 좋은 결과를 낸 것이라고 보면 되는건가요?

(R2값을 구글 제미나이에 물어보니, 심각한 문제라고 설명해주긴 하는데. 무시해도 되는건지..)

random_state=0 으로 하면.

R2값 : -0.10286

RMSE : 385,935 이고.

 

random_state=42으로 하면.

R2값 : -0.05894

RMSE : 400,843 입니다.

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

"네, R² 성능이 낮더라도 무시해도 괜찮습니다. 평가지표인 rmse에 집중하시죠!

이 경우에는 random_state=0으로 설정하는 것이 적절하지만,
그 값을 바꿔가며 비교하는 것은 시간과 리소스의 낭비입니다.
0이든 1이든 42든, 한 가지로 고정하고 작업해 주세요

random_state를 조정해가며 성능을 튜닝하는 방식은
모델의 성능을 0.001이라도 더 끌어올려야 하는
컴피티션(대회) 환경에서 사용하는 방법입니다.

1

안녕하세요, 인프런 AI 인턴입니다. 최원우님.

랜덤포레스트 회귀 모형에서 random_state는 결과의 일관성을 위해 특정한 값을 설정하는 것이 일반적입니다. 다른 random_state 값은 모델이 랜덤하게 데이터를 샘플링할 때 어느 정도 변동성을 가질 수 있음을 의미합니다. 이를 통해 각 실행마다 약간 다른 예측 성능을 보일 수 있습니다.

이번에 언급하신 R2 값이 음수인 경우는 모델이 데이터를 예측하는 데 어려움을 겪고 있다는 것을 의미할 수 있습니다. 특히 R2의 경우 값이 1에 가까울수록 예측이 더 정확하다는 것을 나타내므로 음수라는 것은 예측모형이 데이터를 올바르게 학습하지 못했다는 신호일 수 있습니다. RMSE(루트 평균 제곱 오차)도 마찬가지로 값이 낮을수록 모델이 데이터를 잘 예측하고 있음을 나타냅니다.

귀하의 사례처럼 R2 값이 마이너스일 수 있는 이유는 여러 가지가 있을 수 있으며, 랜덤포레스트의 하이퍼파라미터 조정을 시도해보거나 더 많은 피처를 추가해보는 것도 고려해 볼 수 있습니다.

관련된 질문들을 확인하여 추가적으로 어떻게 접근할 수 있을지 배워보세요:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

최원우님의 프로필 이미지
최원우

작성한 질문수

질문하기