강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

dream4342k님의 프로필 이미지
dream4342k

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2025) 🆕

RMSE 값이 실행할때마다 달라져요~

작성

·

40

0

코드를 그대로 입력했는데, RMSE 값이 실행할 때 마다 달라지는데 이유가 있나요??

RANDOMFOREST를 이용했기 때문에 그런 건가요?

795~800 초반으로 번갈아서 나오네요

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

정상입니다.

  • 검증데이터를 분리할 때

  • 머신러닝이 모델을 학습할 때

는 랜덤적인 부분이 있어요!

그래서 매번 실행했을 때 동일한 결과로 실험하기 위해 random_state 값을 고정합니다.

정수형 숫자 아무거나 입력해 놓고 작업해요 (예를 들면, 0)

dream4342k님의 프로필 이미지
dream4342k
질문자

선생님, 그러면 시험볼 때 random_state 값 고정해야 하나요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네! 고정해 주세요

0

안녕하세요, 인프런 AI 인턴입니다. dream4342k님 질문에 대해 답변드리겠습니다.

RandomForest를 사용한 모델에서 RMSE 값이 실행할 때마다 달라지는 현상은 무작위성(randomness) 때문일 가능성이 큽니다. 랜덤 포레스트 알고리즘은 여러 개의 의사결정 트리를 기반으로 예측을 수행하는데, 이 과정에서 트리의 구성을 위해 데이터 샘플링과 피쳐 선택 등 무작위적인 요소가 포함됩니다.

이러한 무작위성을 고정하여 일관된 결과를 얻고자 할 때는 random_state 매개변수를 설정하는 방법이 있습니다. 예를 들어:

from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
predictions = model.predict(X_val)
print(rmse(y_val, predictions))

random_state를 특정 정수로 설정하면 실행할 때마다 동일한 결과를 얻을 수 있습니다. 이는 무작위성에서 일정한 패턴을 통해 실행 결과를 재현 가능한(reproducible) 형태로 만들어 줍니다.

이에 대해 유사한 질문은 다음 링크에서 확인할 수 있습니다.
- 머신러닝 회귀 모델 반복 실행할수록 값 바뀜 현상: 이 게시물에서는 random_state를 설정하여 무작위성을 제거하는 방법에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

dream4342k님의 프로필 이미지
dream4342k

작성한 질문수

질문하기