작업형2 제출시 질문있습니다
최종 제출시에 train_test_split을 통해 나누어진 X_tr,y_tr을 학습한 모델로 답을 제출하면 X_val 데이터 만큼의 데이터를 학습하지 못해 손해가 발생할 것 같습니다.
데이터를 X_tr,X_val,y_tr,y_val 로 나누어서 어떤 모델이 가장 성능이 좋은지 검증한 후에 최종 제출할때는 전체데이터를 다시 학습한 모델로 pred 를 만들어 제출할려고 하는데 이렇게 해도 문제가 없을지 궁금합니다
답변 1
1
네, 의문이 맞아요!
그런데 실제로 전체 데이터를 사용하면 비슷하거나 성능이 오르거나 성능이 떨어지기도 합니다.
전체 데이터를 사용해도 좋습니다.
다만 X_tr에 최적화된 하이퍼파라미터 튜닝은 하지 않는 것을 추천해요!
질문 드립니다.
0
38
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
33
1
강의자료 일괄 다운로드
0
42
2
수강기간 연장 문의드립니다
0
28
1
list 문제 질문드립니다~
0
30
2
빅분기 실기 12회 재도전
0
40
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
47
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
50
2
문제 3-2 질문드립니다
0
44
2
수강기간 연장 문의 드립니다.
0
58
2
변수, 칼럼 , df 구분
0
50
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
48
2
수강기간 연장 문의드립니다.
0
42
2
수강기한 연장 문의
0
79
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
45
2
수강기간 연장 문의드립니다.
0
71
2
수강연장 문의
0
77
2
수강연장문의
0
53
2





