• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

토픽모델링 날짜 관련 오류

22.11.01 17:24 작성 조회수 119

0

import matplotlib.pyplot as plt

import matplotlib

import seaborn as sns

sns.set_style("darkgrid")

def plotDateTopic(topic_id):

label = "Topic #%d:\n" % topic_id

label += " ".join([vectorizer.get_feature_names()[i]

for i in W[topic_id].argsort()[:-6:-1]])

h = H / H.sum(1, keepdims=True)

h = h[:, topic_id].ravel()

plt.plot(dateNews['date'], h)

plt.fill_between(dateNews['date'], h, alpha=0.5, label=label)

plt.figure(figsize=(40, 10))

plotDateTopic(2)

plotDateTopic(0)

plotDateTopic(4)

plotDateTopic(13)

plotDateTopic(17)

plotDateTopic(9)

plt.xticks(fontsize=25)

plt.legend(fontsize=25, bbox_to_anchor=(0.1, 0.2))

plt.show()

 

이렇게 식을 사용해서 데이터를 추출했더니

 

이런 그림이 나오는데요.

주신 자료의 4) 토픽모델링의 16번은 월별로 나오는데 어떤 부분이 잘못됐는지 궁금합니다!

그리고 맥에서 한글 오류가 나는 건 어떻게 수정하면 될까요?

좋은 강의 감사드립니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까, 인사이저 입니다.

먼저 맥에서 한글폰트가 깨지는 케이스는 아래의 포스트를 참고하시기 바랍니다.
https://wannabe00.tistory.com/entry/Mac%EC%97%90%EC%84%9C-Matplotlib-%EC%82%AC%EC%9A%A9-%EC%8B%9C-%ED%95%9C%EA%B8%80-%EA%B9%A8%EC%A7%90-%ED%95%B4%EA%B2%B0

이전 공유드린 토픽 모델링 코드에, 아래 처럼 폰트를 등록하시면 되겠습니다.

image

그리고 보내주신 스크린샷을 보건데,

그래프를 그릴때 사용한 데이터가 2020년 8월자 데이터로만 구성된 게 아닐까 싶습니다.

matplotlib 가공 전의 데이터셋을 한 번 확인해보시고,

그럼에도 이슈가 있을 시 문의 주시기 바랍니다.

 

감사합니다.