inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지

<실습> TfidfVectorizer 사용하기

TF-IDF 워드클라우드를 만드는 부분의 for문

359

마치판

작성한 질문수 1

0

TF-IDF 워드클라우드를 만드는 부분의 for문에서 [29010, 25676, 25763, 26410, 25503]은 어떻게 나온 건가요?]

웹-크롤링 pandas anaconda 텍스트마이닝

답변 2

0

밝음

혹시 전체 뉴스 데이터에서 tf-idf로 워드클라우드 그릴려면 어떻게 코드 짜야하나요?

0

My Incizor

안녕하십니까, 인사이저입니다.

질문에 답변드리겠습니다.

해당 숫자는 저희가 임의로 넣은 값들로, 제공해드렸던 약 29000개의 데이터에서 5개를 추려낸 것입니다.

즉 데이터의 인덱스 번호를 임의로 지정한 것이지요.

강의를 보시면 아시겠지만, 각각의 뉴스를 기준으로 TFIDFVectorizer와 워드클라우드를 구축하여,

각 뉴스의 주요한 키워드가 강조되는 것을 확인할 수 있습니다.

어떤 뉴스를 사용했는 지는 아래의 코드를 통해 알아볼 수 있습니다.

아래 news.loc[] 부분에 위의 숫자를 하나 씩 입력해보면 어떤 뉴스로 워드클라우드를 만들었는 지 확인할 수 있습니다.

저 값은 임의로 들어간 것이므로,

다른 뉴스에 대해 키워드를 추출해보고 싶다면

[29010, 25676, 25763, 26410, 25503] 대신에

다른 뉴스의 인덱스 번호를 입력해보면 되겠습니다.

감사합니다.

jpype 설치관련

0

1818

2

Konlpy 설치

0

989

2

Konlpy 설치 페이지에서 jpype 설치 링크

0

385

1

맥 os에서 폰트 경로 지정*코랩 사용

0

1248

1

Re. Konlpy 설치오류(Okt 오류)

0

1580

1

Konlpy 설치 오류

0

3830

1

tfidf 관련

0

518

1

TF-IDF 질문입니다.

0

542

1

토픽모델링 날짜 관련 오류

0

263

1

질문드립니다.

0

340

1

워드클라우드 plt.subplot 질문

0

312

1

p54 문의드립니다

0

193

1

문의드립니다.

0

1049

1

문의드립니다

0

210

1

p55 문의드립니다

0

223

1

mecab 설치 오류

0

467

1

mecab 설치 오류

0

1366

1

가이드 53페이지 질문(konlpy 파일 없음)

0

282

1

konlpy 설치 오류

0

621

1

jpype 설치 오류

0

275

1

wordcloud image mask가 적용이 안됩니다.

0

1277

1

wordcloud 설치가 안됩니다

0

271

1

가상환경 3.7.11로 설치한 가상환경을 conda info로 확인한 버전과 python --version으로 확인한 버전과 다릅니다.

0

664

1

p.45 konlpy 설치 확인단계에서 오류가 발생합니다.

0

6058

4