• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

섹션3. 워드클라우드 실습중 문제/질문

21.05.07 03:56 작성 조회수 115

0

섹션3 실습중 문제가 생겨 문의드립니다. 

  1. (문제)워드클라우드 설치도 잘되었는데, 다음과 같은 문제가 계속 발생합니다.

generate_from_frequencies 관련해서 문제가 생기는 것 같은데, 검색해봐도 잘 모르겠더군요.

참고로 generate_from_frequencies(Counter), (counter) 대소문자 모두 해보았습니다.

2. (문제)sample뉴스 단계에서 위와같은 문제가 생겼고, 전처리_샘플뉴스.csv전체파일로 워드 클라우드를 만들때도 비슷한 문제가 있었습니다.

3. (질문)tfidfvectorizer실습 부분에서 다음과 같이 입력하셨는데, 숫자가 의미하는 것이 무엇인지 동영상을 여러번 돌려봐도 모르겠더라구요. 한번 더 설명 부탁드립니다.

 

답변 1

답변을 작성해보세요.

0

안녕하십니까, 인사이저 입니다.

문의사항에 답변드리겠습니다.

-------------------------

1번 2번 모두 wordcloud 생성 시 잘못된 폰트 경로를 지정하여 발생한 것으로 보입니다.

예제 코드에서 쓰인 나눔 고딕(네이버 제공)을 설치하신 후 다시 경로를 설정해보시거나,

아래와 같이 기존에 존재하는 폰트명(예 : AppleGothic)을 사용하여 재시도 해보시기 바랍니다.

나눔 고딕 설치 방법

https://hangeul.naver.com/font

--------------------------------

3번의 숫자들 의미는 '뉴스'를 의미합니다.

약 2만 9천개 가량의 뉴스를 CSV 형태로 제공해드렸는데,

각 뉴스 마다 인덱스 번호가 매겨져 있습니다.

그러므로 해당 번호에는 어떠한 큰 의미는 없으며,

저희가 이해를 돕기 위해 5개의 뉴스를 임의로 선택한 것(인덱스 번호 5개를  임의로 고른 것)이라 보시면 됩니다.

번호를 바꿔보시면 워드클라우드가 다르게 생성될 것이니,

워드클라우드를 생성해보고 싶은 뉴스를 선정하여 해당 인덱스 값을 입력해보시는 것을 추천드립니다.

추가로 이슈가 있을 시 문의 바랍니다.

감사합니다.

hahyeonji님의 프로필

hahyeonji

질문자

2021.05.07

친절한 답변 감사합니다!

위에 제시해주신대로 파일경로 없이 폰트명만으로도 시도해보고,

새로 다운받아서도 해보았는데 같은 에러가 납니다.

그래서 서채관리자를 보다보니 다음과 같이, AppleGothic의 위치가 나와있어서 저대로 해보았는데도.. 같은 에러가 납니다.

복수의 다른 서채들도 서채관리자에 나오는 위치를 그대로 복붙했는데도 작동하지 않습니다.

제가 사용중인 컴퓨터는 Mac, OS는 Big Sur 11.3.1입니다.

아주 기초적인 부분같은데 여러번 질문하게 되어 죄송합니다ㅠㅠ 

인사이저 입니다.

저희도 해결책에 대해 좀 더 강구해봐야 할 것 같습니다.

보내주신 이미지와 같이 AppleGothic의 경로를 지정하여 워드클라우드를 생성했을 때,

저희 쪽에서는 제대로 돌아가는 것을 확인하였습니다.

그리고 font_path를 설정하지 않으면 한글은 깨지지만

영어는 정상 작동 합니다. 한번 아래의 코드를 그대로 따라쳐서 실행되는 지도 확인 부탁드립니다.

영어로 실행에도 에러가 발생한다면

이전에 보내주신 것 처럼 스크린 샷을 찍어서 재문의 부탁드립니다.

저희도 최대한 해결책을 찾아보겠습니다.