random_state 값이 궁금합니다!
2
投稿した質問数 2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
train_test_split 할때 random_state를 보통 0으로 설정하시는데 이 값을 42를 써도되나요??
[작업형2]연습문제 섹션 6에 0으로 두는거랑 42로 두는거랑 r2 값이 0.2 차이나서 궁금합니다!!
回答 1
0
안녕하세요, 인프런 AI 인턴입니다. banilla0309-님.
random_state는 데이터셋을 나누면서 데이터 샘플링의 순서와 방식을 결정하는 시드를 설정하는 과정이기에, 이 값이 달라지면 훈련 데이터와 테스트 데이터의 분포가 달라질 수 있습니다. 따라서, 모델 학습에 활용되는 데이터의 구성이 달라지게 되어 모델의 성능 평가 지표인 r2 값에 차이가 생길 수 있습니다.
특히 비균형 데이터나 데이터 수가 적은 경우에는 이러한 차이가 더 두드러질 수 있습니다. random_state를 0으로 설정하는 것은 특별한 이유에서가 아니라, 단지 관습적으로 쓰이는 숫자일 뿐입니다. 따라서, 42를 비롯한 어떤 숫자라도 자유롭게 사용할 수 있으며, 반복 가능한 결과를 얻고자 하는 시드 값은 상황에 맞게 선택할 수 있습니다.
아래는 관련하여 참고할 수 있는 기존 질문들입니다:
이 답변이 도움이 되었길 바라며, 추가적으로 궁금한 점이 있으시면 언제든지 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
수강기간 연장 가능 여부 문의드립니다
0
20
1
city 컬럼 삭제
0
13
1
3회 기출(작업형 2) 질문 있습니다!!
0
18
1
2유형 탬플릿에 대한 질문입니다
0
28
1
시험환경 질문 드립니다.
0
27
1
수강기간 연장 가능 여부 문의드립니다
0
44
2
문제2-2에서 유의한 변수에서 음수는 유의한지?
0
28
3
강의 만료 후 오프라인 저장 강의 수강 가능 여부
0
38
2
xgboost에 관해
0
43
2
빅데이터분석기사 작업2형
0
47
2
평가지표 RMSE 문의
0
39
2
1-3번문제 질문
0
40
2
회귀모델 평가지표 최근 시험환경에서의 지원여부가 궁금합니다
1
41
2
컬럼 삭제 관련
0
40
2
레이블 인코딩과 원핫 인코딩
0
45
2
검정결과 질문(채택/기각)
0
37
2
수강기간 연장 가능 여부 문의
0
43
2
마인드맵에서 암기해야할 내용은 별마크 인가요
0
42
2
수강 연장 문의드립니다
0
38
2
2유형 관련 질문
0
47
2
수강기간 연장 문의드립니다
0
41
2
로지스틱 회귀 데이터 누락 관련 질문
0
43
2
수강기간 연장 문의드립니다.
0
42
2
작업형1 - 연습문제 1번 관련 질문입니다.
0
50
2

