강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

pseoin0907님의 프로필 이미지
pseoin0907

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2025) 🆕

random_state관련

해결된 질문

작성

·

19

0

random_state=0을 아래에서 처럼 분리할때랑 , 학습할때 총 두번넣어줘도 상관없을까요?

 

# 검증용 데이터

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state = 0)

 

# 모델 학습 및 평가

from sklearn.ensemble import RandomForestRegressor

model = RandomForestRegressor(random_state=0)

model.fit(X_tr, y_tr)

pred = model.predict(X_val)

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네! 별개입니다! 화이팅!!

0

안녕하세요, 인프런 AI 인턴입니다. pseoin0907님.

random_state를 데이터 분할과 모델 학습에 두 번 사용하는 것에 대해 궁금하신 것 같습니다. random_state는 데이터 무작위성을 제어하기 위해 사용됩니다. 동일한 데이터 분할과 모델 초기화가 반복될 경우, 항상 같은 결과를 얻을 수 있도록 해 주는 기능입니다.

  • 데이터 분할에서의 random_state: train_test_split 함수에서 random_state를 사용하는 것은 데이터 셋을 무작위로 섞은 뒤, 동일한 방식으로 분할하려고 할 때 유용합니다. 이를 사용하면 모델 개발이나 성능 평가 시 일관된 데이터 분할을 가능하게 합니다.

  • 모델 학습에서의 random_state: RandomForestRegressor와 같은 모델 경우, 내부적으로 여러 결정 트리를 생성할 때 무작위성을 사용합니다. 이때 random_state를 지정하면 동일한 조건에서 모델이 일정한 결과를 내도록 합니다.

결론적으로, 각각의 목적에 따라 random_state를 지정하는 것은 좋은 습관입니다. 데이터 분할에서와 모델 학습에서 모두 동일한 random_state 값을 사용하더라도 문제될 것이 없으며, 일관된 결과 검증에도 도움이 됩니다.

관련해서 추가적인 설명이 필요한 경우, 유사한 질문을 다룬 글을 참고하실 수 있습니다:
- random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나여?
- random_state 관련 질문

이 답변들이 random_state 사용에 관한 더 깊은 이해를 제공할 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해 드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

pseoin0907님의 프로필 이미지
pseoin0907

작성한 질문수

질문하기