inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

[2/4] NLP 텍스트 데이터 전처리

시각화 한글깨지는 문제

706

yeonsook kwak

작성한 질문수 2

1

안녕하세요

마지막에 리뷰별 단어 수 분포도와 리뷰별 고유한 단어 수 분포도를 그려보는과정에서 한글이 깨지는 문제가 생겼는데 한글폰트를 지정을 해주어도 왜 해결이 안되는지 궁금합니다. 

한글 폰트 코드는다음과 같이 작성했습니다. 

작업환경은 구글 코랩입니다. 

import matplotlib.font_manager as fm
fontpath = 'C:/Windows/Fonts/gulim.ttc'

font = fm.FontProperties(fname=fontpath, size = 9)

# 기본 글꼴 변경
import matplotlib as mpl
mpl.font_manager._rebuild()
mpl.pyplot.rc('font', family='gulim')

python NLP

답변 3

1

박조은

폰트 경로가 맞지 않아 오류가 났네요. 

폰트를 설치하시고 사용하시는 걸 권장드려요.

google Colab 에서는 다음과 같이 사용하시면 됩니다.

# 나눔고딕 설치

!apt -qq -y install fonts-nanum > /dev/null

import matplotlib.font_manager as fm

fontpath = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf'

font = fm.FontProperties(fname=fontpath, size=9)

fm._rebuild()

# 그래프에 retina display 적용

%config InlineBackend.figure_format = 'retina'

# Colab 의 한글 폰트 설정

plt.rc('font', family='NanumBarunGothic') 

0

Hoe Bin Jeong

위 방법대로 설정한 후에 런타임 다시 시작 눌러줘야 적용되는 것 같습니다.

0

yeonsook kwak

알려주셔서 감사합니다. 

word2vec 질문

0

306

1

질문 드립니다

0

326

1

%time clean_train_reviews = apply_by_multiprocessing(\ train['review'], review_to_words, workers=4)

0

329

2

한국어 텍스트 분석과 영어 텍스트 분석의 차이

0

551

1

코랩 실습 링크 파일 다시 올려주시면 안되나요?

0

465

1

강의 자료는 어디서 받을 수 있나요?

0

350

1

data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?

1

719

4

젠심

1

386

1

질문드립니다

1

232

1

질문드립ㄴ디ㅏ

1

409

3

질문드립니다

1

335

2

word2vec 실행 오류

1

382

1

gensim 4.0 버전 문제

1

2173

1

멀티 프로세싱 오류 질문입니다

1

1099

1

1-2 NLP 텍스트 데이터 처리 오류 관련 질문드립니다.

1

352

1

1강 질문드립니다.

1

235

1

질문드립니다.

1

428

2

질문드립니다.

1

210

1

id 말고 어떤 영화인지는 어떻게 알수있을까요?

1

281

1

[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리

1

481

1

has no attribute 'syn0'

2

324

1

영상 "섹션1. [2/4] NLP 텍스트 데이터 전처리" 부분에 대해 질문 있습니다!

1

313

5

wget 오류

1

781

1

html5lib 과 lxml 에서 모두 에러가 발생하고 있습니다.

1

530

1