inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[NLP] Phân tích văn bản Python và xử lý ngôn ngữ tự nhiên thông qua phân tích cảm xúc đánh giá phim IMDB

[3/4] Vector hóa dữ liệu văn bản bằng CountVectorizer

질문드립니다.

210

gbdndl2343

3 câu hỏi đã được viết

1

텍스트 벡터화 부분에서 

 

for tag, count in zip(vocab, dist):
    print(count, tag)

위 부분은 어떤 역할을 하는지 이해가 어렵습니다.
설명 부탁드리겠습니다.
감사합니다.

NLP python

Câu trả lời 1

1

todaycode

안녕하세요.

vocab 이라는 변수에는 벡터화 한 단어들의 사전이 들어있으며,

dist 라는 변수에는 빈도수가 들어있습니다.

그런데 이 두가지 값이 개별 벡터로 되어 있으니 zip을 통해 key-value 형태로 묶어주는 과정입니다.

그래서 어떤 단어가 얼마나 빈도수가 있는지 확인하는 코드입니다.

 

word2vec 질문

0

306

1

질문 드립니다

0

326

1

%time clean_train_reviews = apply_by_multiprocessing(\ train['review'], review_to_words, workers=4)

0

329

2

한국어 텍스트 분석과 영어 텍스트 분석의 차이

0

551

1

코랩 실습 링크 파일 다시 올려주시면 안되나요?

0

465

1

강의 자료는 어디서 받을 수 있나요?

0

350

1

data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?

1

719

4

젠심

1

386

1

질문드립니다

1

232

1

질문드립ㄴ디ㅏ

1

409

3

질문드립니다

1

335

2

word2vec 실행 오류

1

382

1

gensim 4.0 버전 문제

1

2173

1

멀티 프로세싱 오류 질문입니다

1

1099

1

1-2 NLP 텍스트 데이터 처리 오류 관련 질문드립니다.

1

352

1

1강 질문드립니다.

1

235

1

질문드립니다.

1

428

2

id 말고 어떤 영화인지는 어떻게 알수있을까요?

1

281

1

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

1

481

1

has no attribute 'syn0'

2

324

1

영상 "섹션1. [2/4] NLP 텍스트 데이터 전처리" 부분에 대해 질문 있습니다!

1

311

5

wget 오류

1

781

1

html5lib 과 lxml 에서 모두 에러가 발생하고 있습니다.

1

529

1

np.sum(train_data_features, axis = 0)에 대해 질문 드립니다.

1

203

1