교차 검증
교차 검증에서 데이터 셋을 학습,검증,테스트 데이터로 나누어 학습, 검증 데이터를 통해 일차평가하고, 최종적으로 테스트 테이터를 통해 마지막 예측을 하는 것으로 이해했는데요..
k-fold도 그렇고, stratified k fold도 그렇고 코드로 예제 보여주실때엔 학습과 검정데이터로만 전체데이터를 나누어 교차검증 정확도를 평균내더라구요.
데스트 데이터는 그럼 따로 나눌 필요가 없는 것인가요?
제가 잘못이해한 것인지 너무 헷갈립니다,, 알려주세요,,ㅠ_ㅠ
답변 3
2
안녕하십니까,
테스트 데이터가 별도로 있으면 좋습니다(이게 표준 프로세스 입니다).
하지만 전체 데이터 건수가 작아서 테스트 데이터를 따로 분리하면 학습 데이터 량이 작아서 교차 검증만 수행한 것입니다.
교차 검증 후에 별도의 테스트 데이터로 검증 하는게 좀 더 검증에 만전을 기할 수 있습니다.
설 연휴 잘 보내십시요.
0
강사님, 혹시 데이터를 학습, 검증, 테스트 데이터로 나누는 즉, 별도의 테스트 데이터를 분리하는 과정은 cross_val_score()에 포함되어 있는건가요? 아니라면 별도의 테스트 데이터셋의 분리는 코드로 나타냈을 때, 어떤식인지 알려주시면 감사하겠습니다!
학습/테스트 데이터셋으로 나누고 학습 데이터만 교차검증을 해보는 코드를 짜보려고 했는데 생각보다 잘안되네요ㅜㅜ
안녕하세요 열심히 수강중인 학생입니다
0
58
2
정수 인덱싱
0
65
2
넘파이 오류
0
83
2
11강 numpy의 axis 축 질문 드립니다.
0
84
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
76
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
68
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
73
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
62
2
5강 강의 오류가 있어요.
0
81
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
71
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
67
3
파이썬 다운그레이 후 사이킷런 재설치
0
115
2
좋은 강의 감사합니다.
0
70
2
scoring 함수 음수값
0
66
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
98
2
분류 평가 정확도 예측
0
75
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
96
1
카카오톡 채널 있나요
0
104
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
187
2
pca 스케일링 관련하여 질문드립니다.
0
100
2
주피터 대신 구글 코랩
0
169
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
145
2
실루엣 스코어..
0
82
2
float64 null 값 처리 방법
0
99
2





