강의

멘토링

커뮤니티

Inflearn Community Q&A

f10213057669's profile image
f10213057669

asked

[R] Data Collection and Management for All KOSPI/KOSDAQ Stocks

Naver Stock Crawling [Introduction to Web Crawling]

htmltab

Written on

·

347

0

테이블을 못 찾는데.. 어떻게 하나요?ㅠ

R웹-크롤링

Answer 4

0

zff님의 프로필 이미지
zff
Questioner

오.. 이렇게 하니까 잘되네요.. 감사합니다!

0

coco님의 프로필 이미지
coco
Instructor

현재 네이버증권 사이트의 경우 R에서 불러들이면 error페이지가 뜨게 되어 있습니다. (네이버 측에서 페이지를 수정한듯 싶습니다.)

다음과 같은 우회 방식을 이용하여 수집할 수 있으니 참고 하시면 좋을 것 같습니다.

url<-"http://finance.naver.com/item/sise_day.nhn?code=005380&page=1" # 종목 A

url<-"http://finance.naver.com/item/sise_day.nhn?code=005930&page=1" # 종목B

library(httr)

referer <- add_headers(Referer = "http://finance.naver.com/item/sise_day.nhn?code=005380&page=11") #검색해서 들어간 것처럼 위장하기위해 header를 붙여준다

tmp <- GET(url, referer) # GET함수를 통해 해당 서버에 통신을 함 뒤에 referer인자가 위장술

ta<-read_html(tmp)%>% html_nodes(xpath = '/html/body/table[1]') %>% html_table()

ta2<-(ta[[1]])

ta2[-c(1,7,8,9,15),]

0

zff님의 프로필 이미지
zff
Questioner

0

coco님의 프로필 이미지
coco
Instructor

안녕하세요.zff 님 올려주신 화면으로는 에러의 원인을 알기 어렵습니다. 다만 url을 잘못 지정한게 아닐까 싶은데

전체코드를 올려주시면 확인해보도록 하겠습니다. 

f10213057669's profile image
f10213057669

asked

Ask a question