inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

하이퍼 파라미터 튜닝 기법 적용하기1 (XGBoost 실습) (업데이트)

하이퍼 파라미터 튜닝 기법 적용하기1 (XGBoost 실습) 질문입니다

264

문환룡

작성한 질문수 20

0

하이퍼 파라미터 튜닝 기법 적용하기1 (XGBoost 실습),
9분 37초에서 cross_val_score 를 사용할 때
fit() 매소드를 통해 학습을 시킨다음에, cross_value_score 를 사용할 수 있는 것이 아닌가요?
강의 자료 105_PRACTICE_TITANIC_IMPORTANCE 에서는 fit() 매소드를 통해 학습을 시킨다음에 cross_value_score 를 사용했는데 여기서는 바로 cross_value_score를 사용해서 질문드립니다

kaggle 머신러닝 배워볼래요? pandas python

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 이게 사실 어떤 정형화된 룰이 없고, sklearn 도 수시로 변경되고 하면서, 둘다 가능하다 정도로 생각하시면 좋을 것 같아요. 실제로 캐글의 다양한 코드를 보시면, 둘 다의 코드들을 보실 수 있으실꺼예요.

좀더 정확하게 본다면, fit() 은 전체 데이터를 기반으로, 한번에 모델에 적용합니다. cross_val_score() 는 cv 등 k-fold 옵션과 함께, 데이터를 쪼개서, 각 데이터별로 모델에 적용하고(즉, fit 을 자체적으로 하고), 테스트를 합니다.

그래서, 기본적으로는 cross_val_score() 에 생짜 모델을 넣고, 데이터를 쪼개서, 모델에 적용해서, 다양한 데이터에 대한 평균 값을 확인한 후, 최종 결과를 낼 때는 튜닝된 모델을 기반으로, fit() 만으로 전체 데이터를 한번에 적용하는 경우도 많습니다.

그런데, fit() 으로 전체 데이터를 한번에 모델에 적용한 후에, 이를 cross_val_score() 에 넣어서, 쪼개진 데이터로 한번더 fit 시켜서, 테스트를 하기도 합니다. 큰 차이가 없거나, 아예 차이가 없는 경우라서, 기본적으로는 전자가 좀더 많이 쓰지만, 후자로 써도 문제 없다고 생각해주시면 괜찮을 것 같습니다.

 

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

96

1

고차원 데이터 질문

0

82

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

215

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

227

1

sklearn v1.5.1

0

175

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

181

2

missingno 대체

0

172

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

134

1

환불문의

0

271

1

자료공유를 받으려고 하는데 에러가 납니다.

0

165

1

iplot에서 항상 에러나는 분 안계신가용?

0

232

1

사망 여부 영향 가능성

0

147

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

194

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

286

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

251

1

3강 강의 자료 코드 관련 질문입니다

1

343

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

421

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

884

2

Bayesian Optimization LightGBM 적용

0

462

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

217

1

강의 중 에러 질문

0

748

1

cross_val_score 에러

0

467

1