강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của f10213057669
f10213057669

câu hỏi đã được viết

[R] Thu thập và quản lý dữ liệu tất cả các mã cổ phiếu KOSPI/KOSDAQ

Thu thập thông tin chứng khoán Naver [Giới thiệu thu thập dữ liệu web]

htmltab

Viết

·

349

0

테이블을 못 찾는데.. 어떻게 하나요?ㅠ

R웹-크롤링

Câu trả lời 4

0

zff님의 프로필 이미지
zff
Người đặt câu hỏi

오.. 이렇게 하니까 잘되네요.. 감사합니다!

0

coco님의 프로필 이미지
coco
Người chia sẻ kiến thức

현재 네이버증권 사이트의 경우 R에서 불러들이면 error페이지가 뜨게 되어 있습니다. (네이버 측에서 페이지를 수정한듯 싶습니다.)

다음과 같은 우회 방식을 이용하여 수집할 수 있으니 참고 하시면 좋을 것 같습니다.

url<-"http://finance.naver.com/item/sise_day.nhn?code=005380&page=1" # 종목 A

url<-"http://finance.naver.com/item/sise_day.nhn?code=005930&page=1" # 종목B

library(httr)

referer <- add_headers(Referer = "http://finance.naver.com/item/sise_day.nhn?code=005380&page=11") #검색해서 들어간 것처럼 위장하기위해 header를 붙여준다

tmp <- GET(url, referer) # GET함수를 통해 해당 서버에 통신을 함 뒤에 referer인자가 위장술

ta<-read_html(tmp)%>% html_nodes(xpath = '/html/body/table[1]') %>% html_table()

ta2<-(ta[[1]])

ta2[-c(1,7,8,9,15),]

0

zff님의 프로필 이미지
zff
Người đặt câu hỏi

0

coco님의 프로필 이미지
coco
Người chia sẻ kiến thức

안녕하세요.zff 님 올려주신 화면으로는 에러의 원인을 알기 어렵습니다. 다만 url을 잘못 지정한게 아닐까 싶은데

전체코드를 올려주시면 확인해보도록 하겠습니다. 

Hình ảnh hồ sơ của f10213057669
f10213057669

câu hỏi đã được viết

Đặt câu hỏi