inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 하는 웹 크롤링 - 입문편

Rstudio 에서 한글로 작성한 주석이 깨집니다.

516

Sean Yeon

작성한 질문수 4

0

안녕하세요 선생님, 강의 잘 듣고 있는 수강생 입니다. 

현재 DC인싸이트 크롤링 부분 수강중 이온데, 오늘 Rstudio를 실행하니 아래와 같이 한글로 작성한 주석 부분이 깨져서 출력됩니다. 메모장에서도 코드 바꿔가며 불러오기 해놨으나 현상은 동일 했습니다. 조언 부탁 드립니다. 

# (1) ?????? / ????????? / URL ????????????

#     1) ????????????

#     2) ????????? ????????????/?????????/URL??????

# (2) ????????? ????????????

url<-"https://gall.dcinside.com/board/lists/?id=superidea&page=1"

b<-readLines(url, encoding = "UTF-8")

# install.packages("stringr")

library(stringr)

str_detect(b,"gall_tit ub-word")

index<-which(str_detect(b,"gall_tit ub-word"))[-1]  #True ?????? ?????? ???????????? ??????????????? ????????? ??????

b[index+1]  #"gall_tit ub-word" ?????? ????????? ??????????????? +1

b2<-b[index+1]

 

# ????????? URL ???????????? ??????, str_extract()??? ????????? ?????????

웹-크롤링 R

답변 3

0

코코

안녕하세요. 제 생각에는 저장할 때에 인코딩을 잘못 설정했거나, 불러들이고 주석이 깨진 상태로 다시 저장을 해서 그런것 같습니다. ㅠㅠ 인코딩이 깨진상태로 저장이 되면 다시 불러오기는 어렵습니다.

0

Sean Yeon

그래도 안되네요;; 처음부터 Global option 을 UTF-8로 설정하고 주석을 한글로 작성했어야 했나요? 

0

코코

안녕하세요. Sean Yeon 님

Rstudio에서 코드를 열고 왼쪽 상단메뉴에 File - Reopen with encoding을 선택하고 UTF-8을 선택해보시기 바랍니다.

클리앙 강의 시 문의 드립니다.

0

258

0

반복문 활용편 질문

0

291

0

크롤링 후 > character(0) 만 도출....ㅠㅠㅠ

0

326

0

readHTMLTable error

0

331

1

데이터 프레임 오류

0

433

1

str(m3)결과 문의

0

348

1

구글플레이 리뷰 크롤링

0

404

1

예제 파일은 없나요

0

203

0

html함수가 실행되지 않아요

0

262

1

readHTMLTable이 안되서..ㅠ

0

348

2

htmltab 라이브러리 삭제 ... readHTMLTable() 도 안되네요..

0

422

3

클리앙 크롤링 실습 중 문의사항

0

537

1

반복문 활용하기에서 질문 있습니다.

0

290

1

csv 한글깨짐 현상

0

560

1

클리앙 크롤링-1 총결과를 출력할 때

0

350

1

data frame 질문

0

1708

1

질문이 있습니다.

0

553

1

클리앙 크롤링-1 hit 관련 질문

0

276

1

("?<=).*(?=)") 활용 정규식 작성법 문의

0

364

1

클리앙 크롤링-1 질문

0

200

1

클리앙 크롤링 2에서 질문있습니다.

0

185

1

클리앙 싸이트 크롤링 질문 드립니다.

0

195

1

네이버 주식 크롤링 (1) 질문드립니다.

0

370

3

str_extract 자세하게 설명좀 해주세요

1

233

1