강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

밝은 참새님의 프로필 이미지
밝은 참새

작성한 질문수

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

[3/4] CountVectorizer로 텍스트 데이터 벡터화

질문드립니다.

작성

·

204

1

텍스트 벡터화 부분에서 

 

for tag, count in zip(vocab, dist):
    print(count, tag)

위 부분은 어떤 역할을 하는지 이해가 어렵습니다.
설명 부탁드리겠습니다.
감사합니다.

답변 1

1

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

vocab 이라는 변수에는 벡터화 한 단어들의 사전이 들어있으며,

dist 라는 변수에는 빈도수가 들어있습니다.

그런데 이 두가지 값이 개별 벡터로 되어 있으니 zip을 통해 key-value 형태로 묶어주는 과정입니다.

그래서 어떤 단어가 얼마나 빈도수가 있는지 확인하는 코드입니다.

 

밝은 참새님의 프로필 이미지
밝은 참새

작성한 질문수

질문하기