random_state 값이 궁금합니다!
29
작성한 질문수 3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
train_test_split 할때 random_state를 보통 0으로 설정하시는데 이 값을 42를 써도되나요??
[작업형2]연습문제 섹션 6에 0으로 두는거랑 42로 두는거랑 r2 값이 0.2 차이나서 궁금합니다!!
답변 2
0
데이터가 작다보니 차이가 날 수 있어요!
한두번 정도 변경할 수는 있으나 여기에 집중하는 것은 추천하지 않습니다.
아마도 42는 GPT가 좋아하는 숫자 같네요 ㅎㅎ
0, 42, 2026 등 정수면 상관없습니다.
0
안녕하세요, 인프런 AI 인턴입니다. banilla0309-님.
random_state는 데이터셋을 나누면서 데이터 샘플링의 순서와 방식을 결정하는 시드를 설정하는 과정이기에, 이 값이 달라지면 훈련 데이터와 테스트 데이터의 분포가 달라질 수 있습니다. 따라서, 모델 학습에 활용되는 데이터의 구성이 달라지게 되어 모델의 성능 평가 지표인 r2 값에 차이가 생길 수 있습니다.
특히 비균형 데이터나 데이터 수가 적은 경우에는 이러한 차이가 더 두드러질 수 있습니다. random_state를 0으로 설정하는 것은 특별한 이유에서가 아니라, 단지 관습적으로 쓰이는 숫자일 뿐입니다. 따라서, 42를 비롯한 어떤 숫자라도 자유롭게 사용할 수 있으며, 반복 가능한 결과를 얻고자 하는 시드 값은 상황에 맞게 선택할 수 있습니다.
아래는 관련하여 참고할 수 있는 기존 질문들입니다:
이 답변이 도움이 되었길 바라며, 추가적으로 궁금한 점이 있으시면 언제든지 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
독립표본검정
0
9
2
tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??
0
12
2
df.describe() 사용을 자제해야할까요?
0
16
2
shape 결과에 대한 문의
0
17
2
자료 문의
0
13
1
8 회귀 11번
0
15
2
심화 강의 관련 질문
0
17
2
빈도수 구하는 것 질문
0
12
2
커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?
0
24
1
작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의
0
28
2
수강연장가능문의
0
31
2
59. 11회 기출 유형 작업형 1 - 문제2 관련
0
25
2
원핫인코딩 슬라이싱 결과
0
22
2
수강기간 연장 가능 여부 문의드립니다
0
47
2
city 컬럼 삭제
0
31
2
3회 기출(작업형 2) 질문 있습니다!!
0
33
1
2유형 탬플릿에 대한 질문입니다
0
46
1
시험환경 질문 드립니다.
0
36
1
수강기간 연장 가능 여부 문의드립니다
0
58
2
문제2-2에서 유의한 변수에서 음수는 유의한지?
0
45
3
강의 만료 후 오프라인 저장 강의 수강 가능 여부
0
50
2
xgboost에 관해
0
54
2
빅데이터분석기사 작업2형
0
58
2
평가지표 RMSE 문의
0
50
2





