inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

XGBoost를 이용한 위스콘신 유방암 예측(파이썬 Native XGBoost 사용)

XGBoost의 label이 없는 상태에서 예측하는 방법이 궁금합니다.

446

lllwgll

작성한 질문수 1

0

안녕하세요. 강의 잘 들었습니다.^^

XGBoost관련 질의 드립니다.

주어진 데이터를 학습용 데이터, 테스트용 데이터로 추출하고, 이를  DMatrix로 변환 후, get_clf_eval 함수를 통해 예측평가까지 완료하였습니다.

만약 새로운 데이터가 주어졌으나, 새로운 데이터는 y_test, 즉 결과값이 없는 데이터이며, 이를 예측해야하는 상황이라면 어떻게 해야 하나요?

predict함수 인자인 dtest의 label이 없는 상태에서 예측하는 방법 안내 부탁드립니다.

 

dtest = xgb.DMatrix(data=X_test , label=y_test)

xgb_model = xgb.train(params = params , dtrain=dtrain , num_boost_round=num_rounds , evals=wlist )

pred_probs = xgb_model.predict(dtest)

 

 

머신러닝 배워볼래요? 통계 python

답변 1

0

권 철민

안녕하십니까, 

원래 예측은 label이 없는 상태에서 수행합니다. 즉 predict()내의 인자로 feature만 들어갑니다. 

혹시 label이 없는 상태에서 예측이 아니라 label이 없는 상태에서 테스트 데이터의 평가를 질문하신건 아닌지요? 

label이 없는 상태에서의 평가는 불가능합니다. kaggle 같은 경우는 테스트 데이터의 label을 kaggle 시스템 내에서 가지고 있기 때문에 kaggle로 올려서 평가를 합니다. 

원하시는 답변이 아니면, 다시 말씀해 주십시요. 

0

lllwgll

원하는 답변이었습니다. 덕분에 해결하였습니다. 좋은 강의 감사드려요.^^

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

50

2

안녕하세요 열심히 수강중인 학생입니다

0

86

2

정수 인덱싱

0

86

2

넘파이 오류

0

108

2

11강 numpy의 axis 축 질문 드립니다.

0

106

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

92

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

76

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

73

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

75

3

파이썬 다운그레이 후 사이킷런 재설치

0

128

2

좋은 강의 감사합니다.

0

79

2

scoring 함수 음수값

0

72

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

87

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

117

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

193

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

155

2

실루엣 스코어..

0

91

2