하이퍼 파라미터 튜닝 기법 적용하기1 (XGBoost 실습) 질문입니다
264
작성한 질문수 20
답변 1
0
안녕하세요. 이게 사실 어떤 정형화된 룰이 없고, sklearn 도 수시로 변경되고 하면서, 둘다 가능하다 정도로 생각하시면 좋을 것 같아요. 실제로 캐글의 다양한 코드를 보시면, 둘 다의 코드들을 보실 수 있으실꺼예요.
좀더 정확하게 본다면, fit() 은 전체 데이터를 기반으로, 한번에 모델에 적용합니다. cross_val_score() 는 cv 등 k-fold 옵션과 함께, 데이터를 쪼개서, 각 데이터별로 모델에 적용하고(즉, fit 을 자체적으로 하고), 테스트를 합니다.
그래서, 기본적으로는 cross_val_score() 에 생짜 모델을 넣고, 데이터를 쪼개서, 모델에 적용해서, 다양한 데이터에 대한 평균 값을 확인한 후, 최종 결과를 낼 때는 튜닝된 모델을 기반으로, fit() 만으로 전체 데이터를 한번에 적용하는 경우도 많습니다.
그런데, fit() 으로 전체 데이터를 한번에 모델에 적용한 후에, 이를 cross_val_score() 에 넣어서, 쪼개진 데이터로 한번더 fit 시켜서, 테스트를 하기도 합니다. 큰 차이가 없거나, 아예 차이가 없는 경우라서, 기본적으로는 전자가 좀더 많이 쓰지만, 후자로 써도 문제 없다고 생각해주시면 괜찮을 것 같습니다.
자료 공유 질문
0
70
1
Ascii 에러 관련하여 질문드립니다
0
96
1
고차원 데이터 질문
0
82
1
세션4 범주형 데이터 분석 패턴 강의 질문
0
215
2
pandas 2.2.2, xgboost 2.1.3 에러 해결 방법
0
227
1
sklearn v1.5.1
0
175
1
머신러닝 적용을 위한 Feature Engineering 작업1
0
181
2
missingno 대체
0
172
1
scikit-learn 1.5.1 matplotlib 3.9.2
0
134
1
환불문의
0
271
1
자료공유를 받으려고 하는데 에러가 납니다.
0
165
1
iplot에서 항상 에러나는 분 안계신가용?
0
232
1
사망 여부 영향 가능성
0
147
1
섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문
0
194
1
df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?
0
286
1
주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문
0
251
1
3강 강의 자료 코드 관련 질문입니다
1
343
1
맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.
0
421
1
Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.
0
884
2
Bayesian Optimization LightGBM 적용
0
462
2
하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.
1
347
1
중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3
0
217
1
강의 중 에러 질문
0
748
1
cross_val_score 에러
0
467
1





