inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 하는 웹 크롤링 - 입문편

네이버 실시간 검색어 크롤링 질문드립니다.

267

강선미

작성한 질문수 1

0

네이버 메인에서 페이지 소스 보기를 해도 이제 더이상 실시간 검색어가 찾아지질 않습니다. 이 경우에 어떻게 크롤링해야 하는지 궁금합니다.

두번째 질문은 네이버 데이터랩 자료를 크롤링하려고 하는데, 자꾸 불완전한 마지막 행이 발견되었다는 에러메시지가 뜹니다. 소스 코드로는 

url<-"https://datalab.naver.com/keyword/realtimeList.naver?where=main"

b<-readLines(url,encoding="UTF-8")

를 입력하였는데, 이 경우 b의 값이 제가 아는 페이지 소스값과 너무 다르게 나와서 혼란스러운데 이 경우 데이터랩의 자료를 어떻게 가져와야 하나요?

웹-크롤링 R

답변 1

1

코코

안녕하세요. 강선미 님

우선 답변이 늦어져서 죄송합니다.

최근에 네이버 실시간 검색어 페이지에 대한 리뉴얼이 있었습니다.

다시말해, 네이버에서 실시간 검색어를 보여주는 방식이 바뀌었고, 기존의 방식으로는 크롤링이 불가능합니다.

제가 살펴본 결과, 기본적인 방식으로는 크롤링이 힘들 것같고 셀레늄을 이용해서 크롤링 해야할 것 같습니다.

(셀레늄의 경우 웹크롤링 실전편강의에서 다룹니다)

크롤링 입문편 강의를 추후에 점검 할때에 반영해서 (강의추가촬영) 업로드하도록 하겠습니다.

클리앙 강의 시 문의 드립니다.

0

259

0

반복문 활용편 질문

0

291

0

크롤링 후 > character(0) 만 도출....ㅠㅠㅠ

0

327

0

readHTMLTable error

0

332

1

데이터 프레임 오류

0

433

1

str(m3)결과 문의

0

348

1

구글플레이 리뷰 크롤링

0

404

1

예제 파일은 없나요

0

204

0

html함수가 실행되지 않아요

0

262

1

readHTMLTable이 안되서..ㅠ

0

349

2

htmltab 라이브러리 삭제 ... readHTMLTable() 도 안되네요..

0

423

3

클리앙 크롤링 실습 중 문의사항

0

538

1

Rstudio 에서 한글로 작성한 주석이 깨집니다.

0

516

3

반복문 활용하기에서 질문 있습니다.

0

290

1

csv 한글깨짐 현상

0

561

1

클리앙 크롤링-1 총결과를 출력할 때

0

350

1

data frame 질문

0

1709

1

질문이 있습니다.

0

554

1

클리앙 크롤링-1 hit 관련 질문

0

278

1

("?<=).*(?=)") 활용 정규식 작성법 문의

0

365

1

클리앙 크롤링-1 질문

0

201

1

클리앙 크롤링 2에서 질문있습니다.

0

186

1

클리앙 싸이트 크롤링 질문 드립니다.

0

196

1

네이버 주식 크롤링 (1) 질문드립니다.

0

372

3