inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

[3/4] CountVectorizer로 텍스트 데이터 벡터화

CountVectorizer 파라미터 값 질문

254

이해인

작성한 질문수 1

1

안녕하세요.

countvectorizer의 파라미터 값에 대해 궁금해 질문 남깁니다.

찾아보니, tokenizer, analyzer, token_pattern 의 인수가 모두 토큰 생성기 선택에 관한 인수라고 나와있던데 각각의 인수가 뜻하는 게 뭔지 정확히 알고 싶습니다. 

찾아본 바로는

tokenizer: 함수 또는 None(default), 토큰 생성 함수
analyzer: 문자열 {'word', 'char', 'char_wb'} 또는 함수
token_pattern: string, 토큰 정의용 정규표현식

이라고 설명되어있던데 정확한 설명을 구할 수 없어 질문 드립니다. 답변 부탁드립니다.

NLP python

답변 0

word2vec 질문

0

312

1

질문 드립니다

0

335

1

%time clean_train_reviews = apply_by_multiprocessing(\ train['review'], review_to_words, workers=4)

0

337

2

한국어 텍스트 분석과 영어 텍스트 분석의 차이

0

565

1

코랩 실습 링크 파일 다시 올려주시면 안되나요?

0

478

1

강의 자료는 어디서 받을 수 있나요?

0

362

1

data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?

1

734

4

젠심

1

393

1

질문드립니다

1

242

1

질문드립ㄴ디ㅏ

1

415

3

질문드립니다

1

341

2

word2vec 실행 오류

1

394

1

gensim 4.0 버전 문제

1

2180

1

멀티 프로세싱 오류 질문입니다

1

1109

1

1-2 NLP 텍스트 데이터 처리 오류 관련 질문드립니다.

1

360

1

1강 질문드립니다.

1

242

1

질문드립니다.

1

436

2

질문드립니다.

1

221

1

id 말고 어떤 영화인지는 어떻게 알수있을까요?

1

283

1

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

1

486

1

has no attribute 'syn0'

2

330

1

영상 "섹션1. [2/4] NLP 텍스트 데이터 전처리" 부분에 대해 질문 있습니다!

1

319

5

wget 오류

1

790

1

html5lib 과 lxml 에서 모두 에러가 발생하고 있습니다.

1

536

1