답변 1
0
안녕하세요. 답변이 늦어서 대단히 죄송합니다.
네이버증권 관련하여 크롤링 이슈가 있어서 강의 새소식에 관련내용 업로드 해놓았습니다.
------------------------
현재 네이버증권 사이트의 경우 R에서 불러들이면 error페이지가 뜨게 되어 있습니다.
(네이버 측에서 페이지를 수정한듯 싶습니다.)
다음과 같은 우회 방식을 이용하여 수집할 수 있으니 아래코드를 이용하시기 바랍니다.
url<-"http://finance.naver.com/item/sise_day.nhn?code=005380&page=1" # 종목 A
url<-"http://finance.naver.com/item/sise_day.nhn?code=005930&page=1" # 종목B
library(httr)
referer <- add_headers(Referer = "http://finance.naver.com/item/sise_day.nhn?code=005380&page=11") #검색해서 들어간 것처럼 위장하기위해 header를 붙여준다
tmp <- GET(url, referer) # GET함수를 통해 해당 서버에 통신을 함 뒤에 referer인자가 위장술
ta<-read_html(tmp)%>% html_nodes(xpath = '/html/body/table[1]') %>% html_table()
ta2<-(ta[[1]])
ta2[-c(1,7,8,9,15),]