• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

q_topics 입력시 오류가 생기는 이유는

20.09.03 15:35 작성 조회수 331

0

 q_topics을 입력하면 왜 계속 아래와 같은 오류상태로 출력이 되는 걸까요. 수업시간 강의를 보면 한글단어가 잘나오는데 말입니다. 

topic term                   beta

   <int> <chr>                 <dbl>

 1     1 "\xb0\xa1\xb0\xdd" 0.00202 

 2     2 "\xb0\xa1\xb0\xdd" 0.000510

 3     3 "\xb0\xa1\xb0\xdd" 0.00146 

 4     4 "\xb0\xa1\xb0\xdd" 0.000532

 5     5 "\xb0\xa1\xb0\xdd" 0.000549

 6     6 "\xb0\xa1\xb0\xdd" 0.00242 

 7     7 "\xb0\xa1\xb0\xdd" 0.000502

 8     8 "\xb0\xa1\xb0\xdd" 0.00365 

 9     9 "\xb0\xa1\xb0\xdd" 0.00616 

10    10 "\xb0\xa1\xb0\xdd" 0.000805

# ... with 644,960 more rows

답변 4

·

답변을 작성해보세요.

0

dgdg dgdg 님

해결했다니 다행이군요.

이렇게 코드 공유까지 해주셔서 감사합니다.

0

dgdg dgdg님의 프로필

dgdg dgdg

질문자

2020.09.04

우왁! 드디어 나왔다!!! 하루동안 해서 ㅠㅠㅠ

$`1`

  관련기사   구독신청       금지 네이버에서       따르 모바일한경   무단전재   바로가기       밝히 

         1          1          1          1          1          1          1          1          1 

      일본     재배포       정부     지난해   한경닷컴   한국경제 

         1          1          1          1          1          1 

## 혹시 저같이 안나오신분들은...(확실하지 않지만) 참고하시기를

추가라이브러리 설치

###

library(xml2)

library(rvest)

library(dplyr)

#########LDA에 필요한 패키지

#https://junhewk.github.io/text/2017/08/15/complaint-LDA/

install.packages("LDAvis")

install.packages("Rmpfr")

library(stringr)

library(tidytext)

library(KoNLP)

library(ggplot2)

library(lubridate)

library(tm)

library(topicmodels)

library(LDAvis)

library(Rmpfr)

library(tidyverse)

###########리페어 인코딩

comments2<-repair_encoding(comments2, from='utf-8')

comments2<-repair_encoding(comments2)

################### 샘플을 뽑았으니깐

for(i in 1:length(comments-모수)){   => for(i in 1:length(comments2-샘플)){  로 해야하지 않을까

0

dgdg dgdg님의 프로필

dgdg dgdg

질문자

2020.09.03

혹시...

> comments2<-repair_encoding(comments2) 

Best guess: UTF-8 (100% confident) 

50건 이상의 경고들을 발견되었습니다 (이들 중 처음 50건을 확인하기 위해서는 warnings()를 이용하시길 바랍니다).

=> 이렇게 나오는데 정상일까요? // 아.... 왜 계속 깨져서 나올까요... ㅠ

0

안녕하세요.  dgdg dgdg님

인코딩이 깨지는 것 같은데요. 

topic modeling하기전에 데이터들이 글자가 깨지는지 한번 확인 해 보시기 바랍니다.

함수를 적용하다가 글자가 깨질 수도 있고,  데이터를 처음에 import할 때에 깨질 수도 있습니다.

데이터가 제대로 import 되어있다면, 데이터를 

library(rvest)

data<-repair_encoding(data) 

등과 같은 함수를 통해서 인코딩을 변환해주시면 될 것 같습니다.