• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

XGBoost의 label이 없는 상태에서 예측하는 방법이 궁금합니다.

21.11.18 05:28 작성 조회수 304

0

안녕하세요. 강의 잘 들었습니다.^^

XGBoost관련 질의 드립니다.

주어진 데이터를 학습용 데이터, 테스트용 데이터로 추출하고, 이를  DMatrix로 변환 후, get_clf_eval 함수를 통해 예측평가까지 완료하였습니다.

만약 새로운 데이터가 주어졌으나, 새로운 데이터는 y_test, 즉 결과값이 없는 데이터이며, 이를 예측해야하는 상황이라면 어떻게 해야 하나요?

predict함수 인자인 dtest의 label이 없는 상태에서 예측하는 방법 안내 부탁드립니다.

 

dtest = xgb.DMatrix(data=X_test , label=y_test)

xgb_model = xgb.train(params = params , dtrain=dtrain , num_boost_round=num_rounds , evals=wlist )

pred_probs = xgb_model.predict(dtest)

 

 

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

원래 예측은 label이 없는 상태에서 수행합니다. 즉 predict()내의 인자로 feature만 들어갑니다. 

혹시 label이 없는 상태에서 예측이 아니라 label이 없는 상태에서 테스트 데이터의 평가를 질문하신건 아닌지요? 

label이 없는 상태에서의 평가는 불가능합니다. kaggle 같은 경우는 테스트 데이터의 label을 kaggle 시스템 내에서 가지고 있기 때문에 kaggle로 올려서 평가를 합니다. 

원하시는 답변이 아니면, 다시 말씀해 주십시요. 

lllwgll님의 프로필

lllwgll

질문자

2021.11.19

원하는 답변이었습니다. 덕분에 해결하였습니다. 좋은 강의 감사드려요.^^