작성한 질문수
[개정판] 파이썬 머신러닝 완벽 가이드
한글 NLP 실습 - 네이버 영화리뷰 감성 분석 - 01
작성
·
178
0
train set에 fit 한 countvectorizer을 그대로 test set에 이용해야한다는 점은 이해가 가는데,
텍스트 분석의 경우 단어하나하나가 feature가 되는데 만약 train set에는 없고, test set에만 있는 단어는 어떻게 처리가 되나요?
답변 2
1
해당 단어는 예측시 반영되지 않고 제외됩니다
Feature Vectorized되는 데이터 세트는 train 데이타만 기반으로 하기 때문입니다
감사합니다.
옙 감사합니다~