inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

XGBoost 관련 질문입니다

해결된 질문

336

작은빗방울

작성한 질문수 9

0

안녕하세요 강사님, XGBoost관련 질문이 몇가지 생겨 여쭤봅니다!

1. 답변해주신 질문 중, early_stoppings와 early_stopping_rounds의 차이가 없다고 하셨는데, 파이썬 래퍼 xgboost에서 실행을 해보면 early_stopping 파라미터만 설정한 경우 조기중단이 수행이 안되고, early_stopping_rounds를 설정해야만  조기중단이 수행되는데 이 부분이 잘 이해되지 않습니다.

2. xbg.train()에서 evals라는 파라미터에 wlist를 할당하는데 wlist=[(dtrain,'train'),(dtest,'eval')] 입니다. 이 부분에서 evals는 성능평가 데이터셋을 받는 파라미터인데 훈련데이터를 넣어도 되는지 궁금합니다. 

3. Tree pruning 기능이 장점으로 적혀있는데 어떤 파라미터에 의한 기능인지, 아니면 xgboost를 실행하기만 하면 자동적으로 실행되는 시스템적인 장점인지 모르겠습니다..!

4. 교차검증과 결손값이 자체처리된다고 하셨는데 교차검증은 cv() API로 처리되는 것이고, 결손값 자체처리는 데이터 전처리가 필요하지 않다는 이야기로 이해했는데 맞을까요..?

5. XGBoost나 LightGBM을 약한 학습기로 다시 배깅이나 보팅을 하는 것이 가능하지만 수행시간이 너무 오래 걸려 잘 사용되지 않는 것인지 궁금합니다!

6. 책에서 p.231에서는 파라미터명이 num_boost_rounds인데 뒤에서 train()의 파라미터는 num_boost_round인데 어떤 것이 맞는건가요? 둘다 맞다면 num_boost_rounds는 어디서 쓰이는 것인지 궁금합니다.

질문이 많은데 미리 죄송합니다..! 구글링해봐도 원하는 답이 잘안나와서 여쭙습니다! 항상 감사합니다

python 머신러닝 배워볼래요? 통계

답변 1

1

권 철민

안녕하십니까,

1. scikit learn xgboost는 파이썬 wrapper xgboost 를 기반으로 하고 있어서 파이썬 wrapper xgboost 의 파라미터에 호환성을 주지만, 반대의 경우는 아닌것 같습니다.

early_stopping_rounds는 파이썬  wrapper xgboost 용, early_stoppings는 사이킷런 wrapper용이라 파이썬 wrapper에서는 early_stopping_rounds 만 동작하는 것 같습니다.  사이킷런 xgboost는 둘다 동작할 것 입니다.

2. 네, evals의 첫번째 tuple은 학습데이터, 두번째 tuple을 검증 데이터이므로 가능합니다.

3.  Tree pruning은 xgboost 내부 동작입니다. 별도의 하이퍼 파라미터가 없습니다.

4. 특별히 Null값을 바꾸지 않아도  xgboost는 Null값을 인지하여 자체적으로 처리합니다.

5. 성능적으로 약간 떨어져서 xgboost는 보통 배깅을 적용하지는 않습니다.

6. 음, num_boost_round가 맞군요.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

59

2

정수 인덱싱

0

67

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

84

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

76

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

68

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

74

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

62

2

5강 강의 오류가 있어요.

0

82

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

71

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

68

3

파이썬 다운그레이 후 사이킷런 재설치

0

115

2

좋은 강의 감사합니다.

0

71

2

scoring 함수 음수값

0

66

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

98

2

분류 평가 정확도 예측

0

75

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

97

1

카카오톡 채널 있나요

0

105

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

187

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

170

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

145

2

실루엣 스코어..

0

82

2

float64 null 값 처리 방법

0

99

2