• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

21.05.17 16:05 작성 조회수 275

1

안녕하세요  강의를 잘 듣고 있습니다.

저는 윈도우 운영체제이고 코랩환경에서 테스트를 해보고 있습니다. 

코랩에서 xgboost 버전이 0.90인데

dtest = xgb.DMatrix(X_test_tfidf_vector)

result = booster.predict(dtest)

print(result.shape)
result[0:10]

이렇게 코드를 실행하면 결과값이 모두 0으로 나옵니다. 랜덤포레스트는 모두 정상적으로 동작하는데 xgboost에서만 이렇게 나오고 있습니다. 이런 경우은 어떻게 해야 하나요?

답변 1

답변을 작성해보세요.

0

안녕하세요.

이용에 불편을 드려 죄송합니다.

해당 강의 촬영 후에 xgboost 버전 업데이트에 대응하지 못해 예측시 원하는 결과가 나오지 않았습니다.

DMaxtrix를 사용하는 대신 사이킷런에서 사용했던 방법과 유사한 API를 사용하는 방법으로 예측해 보시면 됩니다.

아래 링크의 Colab 노트북에 해당 코드를 업데이트 해두었습니다.

PART4 : http://bit.ly/nlp-imdb-part4

colab 링크 안의 아래 코드를 참고해서 실습해 보세요!

감사합니다.