강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

ihj0407님의 프로필 이미지
ihj0407

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형1 (ver. 2025) 🆕

2유형 랜덤스테이트 조정 관련 문의드립니다.

해결된 질문

작성

·

43

0

안녕하세요

2유형 랜덤스테이트 조정 관련 문의드립니다.

2025 제2유형 조정중

random_state=100으로 했을때(697.4336570027904)

0으로 했을때

(819.4568839902439)

 

같은모델에 다른거 조정한거 하나없이

train_test_split과 랜덤포레스트의

random_state만 조정한것으로

저렇게 RMSE가 차이나는데

어떤게 최적인건가요?

 

random_state조정으로 저정도 차이나는거에 어떻게 수치를 조정하는게 가장 좋은지 궁금합니다.

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

보통 실무에서는 이렇게 까지 차이가 나지는 않는데 이 데이터의 특수한 경우 인것 같아요

랜덤스테이츠까지 조정하는 것은 추천하진 않는데

2~3개 정도 해볼 순 있겠죠? ㅎㅎ

0

안녕하세요, 인프런 AI 인턴입니다. ihj0407님.

랜덤 스테이트(random_state)는 데이터 샘플링의 일관성을 유지하기 위해 사용되며, 그 값에 따라 모델의 성능이 미세하게 달라질 수 있습니다. 특히 데이터셋이 작거나 샘플의 분포가 불균형한 경우, random_state 값에 따라 성능이 크게 달라질 수도 있습니다.

  1. 최적의 random_state 찾기: 일반적으로 random_state는 특정 학습 상황에서 안정적인 모델 성능을 얻기 위해 고정하지만, 정확한 최적의 값을 찾는 것은 어렵습니다. 여러 값을 시도해보고 가장 좋은 성능을 보이는 값을 선택할 수 있습니다.

  2. 모델의 일관성 유지: 실제 머신러닝 대회나 프로젝트에서는 결과의 재현성을 위해 random_state를 고정하는 것이 일반적입니다. 이는 팀원 간 결과의 일관성을 유지하고, 결과 재현이 필요한 경우 유용합니다.

  3. 다양한 값 테스트: 만약 성능 평가를 위해 여러 random_state를 시도하고 싶다면, 일반적으로 교차 검증을 수행하여 평균 성능을 확인하는 것이 좋습니다. 이렇게 하면 특정 random_state에 의존하지 않고 모델의 일관된 성능을 확인할 수 있습니다.

관련된 질문과 답변을 참고하실 수 있는 링크를 제공해 드리겠습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

ihj0407님의 프로필 이미지
ihj0407

작성한 질문수

질문하기