inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형2] 연습문제 섹션 6

random_state 값이 궁금합니다!

29

banilla0309-

작성한 질문수 3

0

train_test_split 할때 random_state를 보통 0으로 설정하시는데 이 값을 42를 써도되나요??
[작업형2]연습문제 섹션 6에 0으로 두는거랑 42로 두는거랑 r2 값이 0.2 차이나서 궁금합니다!!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

데이터가 작다보니 차이가 날 수 있어요!

한두번 정도 변경할 수는 있으나 여기에 집중하는 것은 추천하지 않습니다.

 

아마도 42는 GPT가 좋아하는 숫자 같네요 ㅎㅎ

0, 42, 2026 등 정수면 상관없습니다.

1

banilla0309-

헉맞습니다!! gpt한테 random_state 물어보니 추천해주더라구요!!

감사합니다!!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. banilla0309-님.

random_state는 데이터셋을 나누면서 데이터 샘플링의 순서와 방식을 결정하는 시드를 설정하는 과정이기에, 이 값이 달라지면 훈련 데이터와 테스트 데이터의 분포가 달라질 수 있습니다. 따라서, 모델 학습에 활용되는 데이터의 구성이 달라지게 되어 모델의 성능 평가 지표인 r2 값에 차이가 생길 수 있습니다.

특히 비균형 데이터나 데이터 수가 적은 경우에는 이러한 차이가 더 두드러질 수 있습니다. random_state를 0으로 설정하는 것은 특별한 이유에서가 아니라, 단지 관습적으로 쓰이는 숫자일 뿐입니다. 따라서, 42를 비롯한 어떤 숫자라도 자유롭게 사용할 수 있으며, 반복 가능한 결과를 얻고자 하는 시드 값은 상황에 맞게 선택할 수 있습니다.

아래는 관련하여 참고할 수 있는 기존 질문들입니다:

  1. random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나요?
  2. random_state 는 시험장에서 써야하나요?
  3. 섹션5 작업형2 모의문제2 질문 있습니다.

이 답변이 도움이 되었길 바라며, 추가적으로 궁금한 점이 있으시면 언제든지 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

독립표본검정

0

9

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

12

2

df.describe() 사용을 자제해야할까요?

0

16

2

shape 결과에 대한 문의

0

17

2

자료 문의

0

13

1

8 회귀 11번

0

15

2

심화 강의 관련 질문

0

17

2

빈도수 구하는 것 질문

0

12

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

24

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

28

2

수강연장가능문의

0

31

2

59. 11회 기출 유형 작업형 1 - 문제2 관련

0

25

2

원핫인코딩 슬라이싱 결과

0

22

2

수강기간 연장 가능 여부 문의드립니다

0

47

2

city 컬럼 삭제

0

31

2

3회 기출(작업형 2) 질문 있습니다!!

0

33

1

2유형 탬플릿에 대한 질문입니다

0

46

1

시험환경 질문 드립니다.

0

36

1

수강기간 연장 가능 여부 문의드립니다

0

58

2

문제2-2에서 유의한 변수에서 음수는 유의한지?

0

45

3

강의 만료 후 오프라인 저장 강의 수강 가능 여부

0

50

2

xgboost에 관해

0

54

2

빅데이터분석기사 작업2형

0

58

2

평가지표 RMSE 문의

0

50

2