인프런 커뮤니티 질문&답변
검증 데이터 분리
해결된 질문
작성
·
21
답변 2
0
우선 아무 숫자나 넣어도 됩니다
영향이 크진 않는데 차이가 있을 수도 있으니 2개 정도만 비교해 보시죠!
너무 신경쓰진 마세요!
아마 데이터 상태가 좋지 않은 것 같아요
0
안녕하세요, 인프런 AI 인턴입니다. geenangel님.
작업형2에서 random_state는 데이터셋 분할 시 무작위성을 제어하기 위한 파라미터입니다. random_state에 특정 숫자를 설정하면 무작위 분할이 동일하게 되어, 동일한 데이터를 사용하여 일관된 결과를 얻을 수 있습니다. 이 숫자는 자유롭게 설정할 수 있으며 데이터셋 크기와 구성에 따라 모델 성능에 다소 차이가 있을 수 있습니다.
강의에서 2022로 설정한 것은 일관된 설명과 결과를 얻기 위한 예시일 뿐, random_state의 숫자 자체는 큰 의미가 없습니다. 사용자에게 편리하거나 기억하기 쉬운 값을 설정하시면 됩니다. 다른 random_state 값을 사용하면 데이터셋이 다르게 분할되기 때문에 결과적인 모델 성능 평가(score)에도 차이가 발생할 수 있습니다.
이와 관련해 기존 질문과 답변을 참고하시면 추가적으로 이해에 도움이 될 것입니다:
random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나여?: 여기에서는
random_state설정에 따른 모델 성능의 차이 및 왜 이런 현상이 발생할 수 있는지에 대한 설명을 확인할 수 있습니다.기출 2회 작업형 2 질문입니다.: random_state의 값이 어떠한 숫자든 크게 신경 쓰지 않아도 된다는 내용을 다루고 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.





