검증 데이터 분리

Question

안녕하세요. 작업형2 검증 데이터 분리 부분에서 radom_state에 아무 값이나 넣어도 되는 것 맞나요? 예를 '작업형2모의문제2' 강의에서 선생님은 2022를 넣으셨고 저는 2025를 넣었는데 마지막 print(r2_score(y_test, pred)) 확인 부분에서 차이가 많이 나는 것 같아서요 (선생님 코드에서 결과: -0.03400981426239014 제가 실행한 결과: -0.013191699981689453)

퇴근후딴짓 · Answer

우선 아무 숫자나 넣어도 됩니다 영향이 크진 않는데 차이가 있을 수도 있으니 2개 정도만 비교해 보시죠! 너무 신경쓰진 마세요! 아마 데이터 상태가 좋지 않은 것 같아요

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. geenangel님. 작업형2에서 random_state 는 데이터셋 분할 시 무작위성을 제어하기 위한 파라미터입니다. random_state 에 특정 숫자를 설정하면 무작위 분할이 동일하게 되어, 동일한 데이터를 사용하여 일관된 결과를 얻을 수 있습니다. 이 숫자는 자유롭게 설정할 수 있으며 데이터셋 크기와 구성에 따라 모델 성능에 다소 차이가 있을 수 있습니다. 강의에서 2022로 설정한 것은 일관된 설명과 결과를 얻기 위한 예시일 뿐, random_state 의 숫자 자체는 큰 의미가 없습니다. 사용자에게 편리하거나 기억하기 쉬운 값을 설정하시면 됩니다. 다른 random_state 값을 사용하면 데이터셋이 다르게 분할되기 때문에 결과적인 모델 성능 평가(score)에도 차이가 발생할 수 있습니다. 이와 관련해 기존 질문과 답변을 참고하시면 추가적으로 이해에 도움이 될 것입니다: random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나여? : 여기에서는 random_state 설정에 따른 모델 성능의 차이 및 왜 이런 현상이 발생할 수 있는지에 대한 설명을 확인할 수 있습니다. 기출 2회 작업형 2 질문입니다. : random_state의 값이 어떠한 숫자든 크게 신경 쓰지 않아도 된다는 내용을 다루고 있습니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.