강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

한글 NLP 실습 - 네이버 영화리뷰 감성 분석 - 01

fit & transform

작성

·

178

0

train set에 fit 한 countvectorizer을 그대로 test set에 이용해야한다는 점은 이해가 가는데,

텍스트 분석의 경우 단어하나하나가 feature가 되는데 만약 train set에는 없고, test set에만 있는 단어는 어떻게 처리가 되나요?

답변 2

1

권 철민님의 프로필 이미지
권 철민
지식공유자

해당 단어는  예측시 반영되지 않고 제외됩니다

Feature Vectorized되는 데이터 세트는 train 데이타만 기반으로 하기 때문입니다

감사합니다.

0

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN
질문자

옙 감사합니다~

JACKIE CHAN님의 프로필 이미지
JACKIE CHAN

작성한 질문수

질문하기