강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

김희준님의 프로필 이미지
김희준

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

자연어 처리에서 사용자 지정어를 설정하는방법이 궁금합니다

작성

·

193

0

culture shock 처럼 word_tokenizer를 쓰면 두단어를 분리하는데 하나의 단어처럼 분리하는 파라미터는 없나요?

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

두단어를 분리하는데 하나의 단어처럼 분리하는 파라미터는 없습니다.

텍스트를 tokenizer에 입력하기 전에 dictionary등을 통해서 두단어를 한단어로 인식해야 하는 단어들을 등록하고,  culture shock는 culture_shock로 변환한 뒤에 tokenizer에 입력해야 할 것 같습니다.

감사합니다.

김희준님의 프로필 이미지
김희준

작성한 질문수

질문하기