교차 검증 시에 계수나 규칙이 계속 바뀌는건가요?
326
작성한 질문수 1
안녕하세요
교차검증에 대해 잘 이해가 안되서요 ㅠㅠ
만약 3번 교차검증을 한다했을 때
첫번째 학습을 하고 나서 두번째 학습시에 첫번째 모델을 기반으로 분류라면 분류규칙이라든지 회귀라면 회귀계수가 변경이 된고 셋번째 학습시에 두번째 모델을 기반으로 변경이 계속 되는건가요?
답변 1
0
안녕하십니까,
교차 검증은 학습과 검증(평가) 데이터를 여러번 변경하면서 모델을 학습하고 평가하는 방식입니다. 모델 성능에 대한 평가를 여러번 수행해서 평가의 공정성(?)을 높이기 위한 방식입니다.
그래서 교차검증은 학습을 할때마다 학습 데이터를 변경하여 모델을 재 학습하고 학습된 해당 모델을 검증 데이터로 평가합니다. 첫번째 학습시에는 첫번째 학습 데이터로 모델을 학습하고 남아 있는 검증 데이터로 평가합니다. 두번째 학습 시에는 변경된 두번째 학습 데이터로 모델을 학습하고 변경된 검증 데이터로 평가합니다. 이런식으로 여러번 학습과 검증 데이터를 변경하면서 진행하는 방식입니다.
감사합니다.
0
그건 구현을 어떻게 하느냐에 따라 달라집니다.
GridSearchCV는 하이퍼 파라미터 튜닝과 교차 검증이 함께 되어 있기에 가장 평가 성능이 좋은 모델로 최종적으로 자동 학습될 수 있습니다.
하지만 일반적인 Cross validation은 최종 테스트 데이터로 예측할 때 학습 된 몇번째 모델을 이용하거나 하지 않습니다. Cross validation은 해당 모델의 평가를 좀 더 다양하게 확인하기 위함입니다. 이를 이용해서 가장 좋은 성능을 가졌을 때의 일부 데이터 세트로 모델을 학습할 필요가 없습니다. 일반적인 Cross validation은 모델의 평가만을 위한 것이라고 생각해 주시면 됩니다.
다만 Cross validation의 Kfold등을 이용해서 가장 좋은 성능을 가졌을 때의 데이터 세트를 이용하여 모델을 학습하고, 이를 이용해서 예측할 수는 있습니다. 하지만 해당 방식은 오버피팅의 우려가 상대적으로 높습니다.
감사합니다.
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
55
2
안녕하세요 열심히 수강중인 학생입니다
0
90
2
정수 인덱싱
0
86
2
넘파이 오류
0
110
2
11강 numpy의 axis 축 질문 드립니다.
0
107
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
95
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
77
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
83
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
74
2
5강 강의 오류가 있어요.
0
90
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
81
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
78
3
파이썬 다운그레이 후 사이킷런 재설치
0
129
2
좋은 강의 감사합니다.
0
80
2
scoring 함수 음수값
0
72
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
108
2
분류 평가 정확도 예측
0
88
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
114
1
카카오톡 채널 있나요
0
118
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
193
2
pca 스케일링 관련하여 질문드립니다.
0
109
2
주피터 대신 구글 코랩
0
184
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
156
2
실루엣 스코어..
0
93
2





