검증 데이터 분리
안녕하세요.
작업형2 검증 데이터 분리 부분에서 radom_state에 아무 값이나 넣어도 되는 것 맞나요? 예를 '작업형2모의문제2' 강의에서 선생님은 2022를 넣으셨고 저는 2025를 넣었는데 마지막
print(r2_score(y_test, pred))확인 부분에서 차이가 많이 나는 것 같아서요
(선생님 코드에서 결과: -0.03400981426239014
제가 실행한 결과:
-0.013191699981689453)
답변 2
0
우선 아무 숫자나 넣어도 됩니다
영향이 크진 않는데 차이가 있을 수도 있으니 2개 정도만 비교해 보시죠!
너무 신경쓰진 마세요!
아마 데이터 상태가 좋지 않은 것 같아요
0
안녕하세요, 인프런 AI 인턴입니다. geenangel님.
작업형2에서 random_state는 데이터셋 분할 시 무작위성을 제어하기 위한 파라미터입니다. random_state에 특정 숫자를 설정하면 무작위 분할이 동일하게 되어, 동일한 데이터를 사용하여 일관된 결과를 얻을 수 있습니다. 이 숫자는 자유롭게 설정할 수 있으며 데이터셋 크기와 구성에 따라 모델 성능에 다소 차이가 있을 수 있습니다.
강의에서 2022로 설정한 것은 일관된 설명과 결과를 얻기 위한 예시일 뿐, random_state의 숫자 자체는 큰 의미가 없습니다. 사용자에게 편리하거나 기억하기 쉬운 값을 설정하시면 됩니다. 다른 random_state 값을 사용하면 데이터셋이 다르게 분할되기 때문에 결과적인 모델 성능 평가(score)에도 차이가 발생할 수 있습니다.
이와 관련해 기존 질문과 답변을 참고하시면 추가적으로 이해에 도움이 될 것입니다:
random_state 값에 따라서 값이 큰 차이가 나는 경우가 있나여?: 여기에서는
random_state설정에 따른 모델 성능의 차이 및 왜 이런 현상이 발생할 수 있는지에 대한 설명을 확인할 수 있습니다.기출 2회 작업형 2 질문입니다.: random_state의 값이 어떠한 숫자든 크게 신경 쓰지 않아도 된다는 내용을 다루고 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
ID 전처리 이유
0
7
1
데이터제공
0
5
1
예시문제 작업형3 꼬리질문2번
0
5
0
데이터 개수를 구할 때, len과 value_counts 차이
0
9
1
작업형 2 제출방
0
7
1
인코딩 스케일링 순서
0
13
2
실제 시험에서도 공식을 문제에서 주는지
0
12
2
수강 연장 문의
0
11
2
작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ
0
17
1
14강 "" 사용 관련 질문
0
17
2
캐글 제출 점수
0
22
2
기출 마무리 방법
0
42
2
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
26
2
데이터프레임 슬라이싱 인덱싱 질문2
0
26
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
33
2
강의자료 다운로드 여부
0
35
2
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
28
2
원핫 인코딩 관련
0
38
2
타겟 분리
0
37
2
Id 삭제
0
43
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
39
2
원핫인코딩 코드 질문
0
35
2
map 함수 사용 필수적인가요
0
46
2
수강 기한 연장 문의드립니다.
0
50
2





