q_topics 입력시 오류가 생기는 이유는

Question

q_topics을 입력하면 왜 계속 아래와 같은 오류상태로 출력이 되는 걸까요. 수업시간 강의를 보면 한글단어가 잘나오는데 말입니다.

topic term beta

1 1 "\xb0\xa1\xb0\xdd" 0.00202

2 2 "\xb0\xa1\xb0\xdd" 0.000510

3 3 "\xb0\xa1\xb0\xdd" 0.00146

4 4 "\xb0\xa1\xb0\xdd" 0.000532

5 5 "\xb0\xa1\xb0\xdd" 0.000549

6 6 "\xb0\xa1\xb0\xdd" 0.00242

7 7 "\xb0\xa1\xb0\xdd" 0.000502

8 8 "\xb0\xa1\xb0\xdd" 0.00365

9 9 "\xb0\xa1\xb0\xdd" 0.00616

10 10 "\xb0\xa1\xb0\xdd" 0.000805

# ... with 644,960 more rows

Answer

dgdg dgdg님 해결했다니 다행이군요. 이렇게 코드 공유까지 해주셔서 감사합니다.

Answer

우왁! 드디어 나왔다!!! 하루동안 해서 ㅠㅠㅠ

$`1`

1 1 1 1 1 1 1 1 1

일본 재배포 정부 지난해 한경닷컴 한국경제

1 1 1 1 1 1

## 혹시 저같이 안나오신분들은...(확실하지 않지만) 참고하시기를

추가라이브러리 설치

###

library(xml2)

library(rvest)

library(dplyr)

#########LDA에 필요한 패키지

#https://junhewk.github.io/text/2017/08/15/complaint-LDA/

install.packages("LDAvis")

install.packages("Rmpfr")

library(stringr)

library(tidytext)

library(KoNLP)

library(ggplot2)

library(lubridate)

library(tm)

library(topicmodels)

library(LDAvis)

library(Rmpfr)

library(tidyverse)

###########리페어 인코딩

comments2<-repair_encoding(comments2, from='utf-8')

comments2<-repair_encoding(comments2)

################### 샘플을 뽑았으니깐

for(i in 1:length(comments-모수)){ => for(i in 1:length(comments2-샘플)){ 로 해야하지 않을까

Answer

혹시...

> comments2<-repair_encoding(comments2)

Best guess: UTF-8 (100% confident)

50건 이상의 경고들을 발견되었습니다 (이들 중 처음 50건을 확인하기 위해서는 warnings()를 이용하시길 바랍니다).

=> 이렇게 나오는데 정상일까요? // 아.... 왜 계속 깨져서 나올까요... ㅠ

Answer

안녕하세요.dgdg dgdg님 인코딩이 깨지는 것 같은데요. topic modeling하기전에 데이터들이 글자가 깨지는지 한번 확인 해 보시기 바랍니다. 함수를 적용하다가 글자가 깨질 수도 있고, 데이터를 처음에 import할 때에 깨질 수도 있습니다. 데이터가 제대로 import 되어있다면, 데이터를 library(rvest) data<-repair_encoding(data) 등과 같은 함수를 통해서 인코딩을 변환해주시면 될 것 같습니다.

dgdg dgdg

q_topics 입력시 오류가 생기는 이유는

이 글과 비슷한 Q&A

ADP 자격증 대비 강의 개설 문의

캐시 관련 질문입니다.

클라이언트 프로그래머 커리어 고민

ETag 질문입니다.