[NLP] Phân tích văn bản Python và xử lý ngôn ngữ tự nhiên thông qua phân tích cảm xúc đánh giá phim IMDB

[3/4] Vector hóa dữ liệu văn bản bằng CountVectorizer

질문드립니다.

2021-11-21T15:26:56.922Z

220

gbdndl2343

3 câu hỏi đã được viết

텍스트 벡터화 부분에서

for tag, count in zip(vocab, dist):
    print(count, tag)

위 부분은 어떤 역할을 하는지 이해가 어렵습니다.
설명 부탁드리겠습니다.
감사합니다.

NLP python

Câu trả lời 1

todaycode

2021-11-22T11:01:41.335Z

안녕하세요.

vocab 이라는 변수에는 벡터화 한 단어들의 사전이 들어있으며,

dist 라는 변수에는 빈도수가 들어있습니다.

그런데 이 두가지 값이 개별 벡터로 되어 있으니 zip을 통해 key-value 형태로 묶어주는 과정입니다.

그래서 어떤 단어가 얼마나 빈도수가 있는지 확인하는 코드입니다.

word2vec 질문

2023-08-12T12:09:45.129Z

312

질문 드립니다

2023-07-23T15:36:03.369Z

335

%time clean_train_reviews = apply_by_multiprocessing(\ train['review'], review_to_words, workers=4)

2023-07-23T12:18:07.021Z

337

한국어 텍스트 분석과 영어 텍스트 분석의 차이

2023-05-30T00:43:09.936Z

564

코랩 실습 링크 파일 다시 올려주시면 안되나요?

2023-05-29T15:59:20.504Z

478

강의 자료는 어디서 받을 수 있나요?

2023-04-09T12:52:54.466Z

362

data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?

2022-07-27T07:15:48.300Z

734

젠심

2022-03-28T00:47:56.224Z

393

질문드립니다

2022-03-25T08:31:21.557Z

242

질문드립ㄴ디ㅏ

2022-03-25T04:38:17.898Z

415

질문드립니다

2022-03-25T03:48:06.564Z

341

word2vec 실행 오류

2022-03-22T06:04:20.113Z

394

gensim 4.0 버전 문제

2022-03-18T08:52:33.578Z

2180

멀티 프로세싱 오류 질문입니다

2022-01-26T13:13:00.384Z

1109

1-2 NLP 텍스트 데이터 처리 오류 관련 질문드립니다.

2022-01-15T18:49:07.919Z

360

1강 질문드립니다.

2022-01-14T07:53:25.331Z

242

질문드립니다.

2021-12-28T09:43:40.950Z

436

id 말고 어떤 영화인지는 어떻게 알수있을까요?

2021-11-06T22:33:30.646Z

283

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

2021-05-17T07:05:50.336Z

486

has no attribute 'syn0'

2021-04-15T20:37:05.750Z

329

영상 "섹션1. [2/4] NLP 텍스트 데이터 전처리" 부분에 대해 질문 있습니다!

2021-04-11T08:01:45.205Z

319

wget 오류

2021-03-07T14:53:53.291Z

790

html5lib 과 lxml 에서 모두 에러가 발생하고 있습니다.

2021-01-10T11:55:13.921Z

536

np.sum(train_data_features, axis = 0)에 대해 질문 드립니다.

2020-12-10T01:56:05.209Z

208