inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

[作業型2] 練習問題 セクション 6

random_state 값이 궁금합니다!

2

banilla0309-

投稿した質問数 2

0

train_test_split 할때 random_state를 보통 0으로 설정하시는데 이 값을 42를 써도되나요??
[작업형2]연습문제 섹션 6에 0으로 두는거랑 42로 두는거랑 r2 값이 0.2 차이나서 궁금합니다!!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. banilla0309-님.

random_state는 데이터셋을 나누면서 데이터 샘플링의 순서와 방식을 결정하는 시드를 설정하는 과정이기에, 이 값이 달라지면 훈련 데이터와 테스트 데이터의 분포가 달라질 수 있습니다. 따라서, 모델 학습에 활용되는 데이터의 구성이 달라지게 되어 모델의 성능 평가 지표인 r2 값에 차이가 생길 수 있습니다.

특히 비균형 데이터나 데이터 수가 적은 경우에는 이러한 차이가 더 두드러질 수 있습니다. random_state를 0으로 설정하는 것은 특별한 이유에서가 아니라, 단지 관습적으로 쓰이는 숫자일 뿐입니다. 따라서, 42를 비롯한 어떤 숫자라도 자유롭게 사용할 수 있으며, 반복 가능한 결과를 얻고자 하는 시드 값은 상황에 맞게 선택할 수 있습니다.

아래는 관련하여 참고할 수 있는 기존 질문들입니다:

  1. random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나요?
  2. random_state 는 시험장에서 써야하나요?
  3. 섹션5 작업형2 모의문제2 질문 있습니다.

이 답변이 도움이 되었길 바라며, 추가적으로 궁금한 점이 있으시면 언제든지 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

수강기간 연장 가능 여부 문의드립니다

0

20

1

city 컬럼 삭제

0

13

1

3회 기출(작업형 2) 질문 있습니다!!

0

18

1

2유형 탬플릿에 대한 질문입니다

0

28

1

시험환경 질문 드립니다.

0

27

1

수강기간 연장 가능 여부 문의드립니다

0

44

2

문제2-2에서 유의한 변수에서 음수는 유의한지?

0

28

3

강의 만료 후 오프라인 저장 강의 수강 가능 여부

0

38

2

xgboost에 관해

0

43

2

빅데이터분석기사 작업2형

0

47

2

평가지표 RMSE 문의

0

39

2

1-3번문제 질문

0

40

2

회귀모델 평가지표 최근 시험환경에서의 지원여부가 궁금합니다

1

41

2

컬럼 삭제 관련

0

40

2

레이블 인코딩과 원핫 인코딩

0

45

2

검정결과 질문(채택/기각)

0

37

2

수강기간 연장 가능 여부 문의

0

43

2

마인드맵에서 암기해야할 내용은 별마크 인가요

0

42

2

수강 연장 문의드립니다

0

38

2

2유형 관련 질문

0

47

2

수강기간 연장 문의드립니다

0

41

2

로지스틱 회귀 데이터 누락 관련 질문

0

43

2

수강기간 연장 문의드립니다.

0

42

2

작업형1 - 연습문제 1번 관련 질문입니다.

0

50

2