inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2025)

random_state관련

해결된 질문

38

pseoin0907

작성한 질문수 18

0

random_state=0을 아래에서 처럼 분리할때랑 , 학습할때 총 두번넣어줘도 상관없을까요?

 

# 검증용 데이터

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state = 0)

 

# 모델 학습 및 평가

from sklearn.ensemble import RandomForestRegressor

model = RandomForestRegressor(random_state=0)

model.fit(X_tr, y_tr)

pred = model.predict(X_val)

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

네! 별개입니다! 화이팅!!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. pseoin0907님.

random_state를 데이터 분할과 모델 학습에 두 번 사용하는 것에 대해 궁금하신 것 같습니다. random_state는 데이터 무작위성을 제어하기 위해 사용됩니다. 동일한 데이터 분할과 모델 초기화가 반복될 경우, 항상 같은 결과를 얻을 수 있도록 해 주는 기능입니다.

  • 데이터 분할에서의 random_state: train_test_split 함수에서 random_state를 사용하는 것은 데이터 셋을 무작위로 섞은 뒤, 동일한 방식으로 분할하려고 할 때 유용합니다. 이를 사용하면 모델 개발이나 성능 평가 시 일관된 데이터 분할을 가능하게 합니다.

  • 모델 학습에서의 random_state: RandomForestRegressor와 같은 모델 경우, 내부적으로 여러 결정 트리를 생성할 때 무작위성을 사용합니다. 이때 random_state를 지정하면 동일한 조건에서 모델이 일정한 결과를 내도록 합니다.

결론적으로, 각각의 목적에 따라 random_state를 지정하는 것은 좋은 습관입니다. 데이터 분할에서와 모델 학습에서 모두 동일한 random_state 값을 사용하더라도 문제될 것이 없으며, 일관된 결과 검증에도 도움이 됩니다.

관련해서 추가적인 설명이 필요한 경우, 유사한 질문을 다룬 글을 참고하실 수 있습니다:
- random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나여?
- random_state 관련 질문

이 답변들이 random_state 사용에 관한 더 깊은 이해를 제공할 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해 드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

추가질문 합니다

0

7

1

시험환경 구름

0

9

1

2유형 질문드려요

0

7

1

RandomForest vs lgb

0

18

1

전처리 관련질문

0

12

2

작업형3 기출

0

12

1

유형2에서 데이터분할 생략 가능여부

0

20

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

10

1

괄호 사용

0

15

1

작업형 2 데이터 전처리 질문

0

18

1

11회 기출 유형 작업형1 문제 3-1

0

13

0

예시문제 작업형2 (ver2023) 질문입니다

0

16

1

Data type에 따른 처리

0

15

2

데이터 전처리 관련

0

15

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

21

2

pd.get_dummies()가 bool로 반환

0

18

2

대응표본검정 레빈

0

23

3

단일표본검정 문제 유형

0

23

2

[작업형 3] 6~7. 카이제곱 검정

0

22

2

9회 작업형3 문제 1-1

0

37

2

최종답안 계산 방식 질문

0

25

1

시험 치기 전 급하게 질문 사항

0

41

2