인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

cksdn50077392's profile image
cksdn50077392

asked

[Revised Edition] The Complete Guide to Python Machine Learning

Korean NLP Practice - Naver Movie Review Sentiment Analysis - 01

fit & transform

Written on

·

175

0

train set에 fit 한 countvectorizer을 그대로 test set에 이용해야한다는 점은 이해가 가는데,

텍스트 분석의 경우 단어하나하나가 feature가 되는데 만약 train set에는 없고, test set에만 있는 단어는 어떻게 처리가 되나요?

통계python머신러닝 배워볼래요?

Answer 2

1

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

해당 단어는  예측시 반영되지 않고 제외됩니다

Feature Vectorized되는 데이터 세트는 train 데이타만 기반으로 하기 때문입니다

감사합니다.

0

cksdn50077392님의 프로필 이미지
cksdn50077392
Questioner

옙 감사합니다~

cksdn50077392's profile image
cksdn50077392

asked

Ask a question