기출7회-작업형2에서 random_state = 0 과 42 차이에 대한 질문
7회기출 풀면서,랜덤포레스트회귀로 풀었는데. R2값이 마이너스라고 놀랐고. 아래는 random_state 설정별 결과값인데, 0이 더 좋은 결과를 낸 것이라고 보면 되는건가요?
(R2값을 구글 제미나이에 물어보니, 심각한 문제라고 설명해주긴 하는데. 무시해도 되는건지..)
random_state=0 으로 하면.
R2값 : -0.10286
RMSE : 385,935 이고.
random_state=42으로 하면.
R2값 : -0.05894
RMSE : 400,843 입니다.
답변 2
1
"네, R² 성능이 낮더라도 무시해도 괜찮습니다. 평가지표인 rmse에 집중하시죠!
이 경우에는 random_state=0으로 설정하는 것이 적절하지만,
그 값을 바꿔가며 비교하는 것은 시간과 리소스의 낭비입니다.
0이든 1이든 42든, 한 가지로 고정하고 작업해 주세요 ☹
random_state를 조정해가며 성능을 튜닝하는 방식은
모델의 성능을 0.001이라도 더 끌어올려야 하는
컴피티션(대회) 환경에서 사용하는 방법입니다.
1
안녕하세요, 인프런 AI 인턴입니다. 최원우님.
랜덤포레스트 회귀 모형에서 random_state는 결과의 일관성을 위해 특정한 값을 설정하는 것이 일반적입니다. 다른 random_state 값은 모델이 랜덤하게 데이터를 샘플링할 때 어느 정도 변동성을 가질 수 있음을 의미합니다. 이를 통해 각 실행마다 약간 다른 예측 성능을 보일 수 있습니다.
이번에 언급하신 R2 값이 음수인 경우는 모델이 데이터를 예측하는 데 어려움을 겪고 있다는 것을 의미할 수 있습니다. 특히 R2의 경우 값이 1에 가까울수록 예측이 더 정확하다는 것을 나타내므로 음수라는 것은 예측모형이 데이터를 올바르게 학습하지 못했다는 신호일 수 있습니다. RMSE(루트 평균 제곱 오차)도 마찬가지로 값이 낮을수록 모델이 데이터를 잘 예측하고 있음을 나타냅니다.
귀하의 사례처럼 R2 값이 마이너스일 수 있는 이유는 여러 가지가 있을 수 있으며, 랜덤포레스트의 하이퍼파라미터 조정을 시도해보거나 더 많은 피처를 추가해보는 것도 고려해 볼 수 있습니다.
관련된 질문들을 확인하여 추가적으로 어떻게 접근할 수 있을지 배워보세요:
- 섹션5 작업형2 모의문제2 질문 있습니다.:
random_state에 따라 성능이 변하는 상황에 대한 설명과 모델의 최적화를 어떻게 시도할 수 있는지에 대한 답변을 제공합니다.
- 작업형 2 기출 등과 해서 계속 반복해서 연습하던 중에요:
random_state설정에 대한 일반적 설명과 그 효용성에 대해 안내합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형 2 기출7회분에서
0
14
1
작업형2 모의문제1 (30강)
0
22
2
수강 기간 연장 문의 드립니다.
0
27
2
수강 계획과 관련해 문의 드립니다.
0
24
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
47
2
작업형 1 -연습문제 4-6
0
34
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
37
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
42
2
인덱스 슬라이싱
0
36
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
48
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
63
2
강의 기간 연장 가능여부 검토 요청건
0
50
2
수강기간 연장 문의 드립니다
0
46
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
57
2
수강기간 연장 문의드립니다.
0
60
2





