Written on
·
175
0
train set에 fit 한 countvectorizer을 그대로 test set에 이용해야한다는 점은 이해가 가는데,
텍스트 분석의 경우 단어하나하나가 feature가 되는데 만약 train set에는 없고, test set에만 있는 단어는 어떻게 처리가 되나요?
Answer 2
1
해당 단어는 예측시 반영되지 않고 제외됩니다
Feature Vectorized되는 데이터 세트는 train 데이타만 기반으로 하기 때문입니다
감사합니다.
0