강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

lllwgll님의 프로필 이미지
lllwgll

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

XGBoost를 이용한 위스콘신 유방암 예측(파이썬 Native XGBoost 사용)

XGBoost의 label이 없는 상태에서 예측하는 방법이 궁금합니다.

작성

·

442

0

안녕하세요. 강의 잘 들었습니다.^^

XGBoost관련 질의 드립니다.

주어진 데이터를 학습용 데이터, 테스트용 데이터로 추출하고, 이를  DMatrix로 변환 후, get_clf_eval 함수를 통해 예측평가까지 완료하였습니다.

만약 새로운 데이터가 주어졌으나, 새로운 데이터는 y_test, 즉 결과값이 없는 데이터이며, 이를 예측해야하는 상황이라면 어떻게 해야 하나요?

predict함수 인자인 dtest의 label이 없는 상태에서 예측하는 방법 안내 부탁드립니다.

 

dtest = xgb.DMatrix(data=X_test , label=y_test)

xgb_model = xgb.train(params = params , dtrain=dtrain , num_boost_round=num_rounds , evals=wlist )

pred_probs = xgb_model.predict(dtest)

 

 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

원래 예측은 label이 없는 상태에서 수행합니다. 즉 predict()내의 인자로 feature만 들어갑니다. 

혹시 label이 없는 상태에서 예측이 아니라 label이 없는 상태에서 테스트 데이터의 평가를 질문하신건 아닌지요? 

label이 없는 상태에서의 평가는 불가능합니다. kaggle 같은 경우는 테스트 데이터의 label을 kaggle 시스템 내에서 가지고 있기 때문에 kaggle로 올려서 평가를 합니다. 

원하시는 답변이 아니면, 다시 말씀해 주십시요. 

lllwgll님의 프로필 이미지
lllwgll
질문자

원하는 답변이었습니다. 덕분에 해결하였습니다. 좋은 강의 감사드려요.^^

lllwgll님의 프로필 이미지
lllwgll

작성한 질문수

질문하기