inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[R] KOSPI/KOSDAQ 전 종목 데이터 수집 및 관리

네이버 증권 크롤링 [웹크롤링입문편]

htmltab

354

zff

작성한 질문수 4

0

테이블을 못 찾는데.. 어떻게 하나요?ㅠ

R 웹-크롤링

답변 4

0

zff

오.. 이렇게 하니까 잘되네요.. 감사합니다!

0

코코

현재 네이버증권 사이트의 경우 R에서 불러들이면 error페이지가 뜨게 되어 있습니다. (네이버 측에서 페이지를 수정한듯 싶습니다.)

다음과 같은 우회 방식을 이용하여 수집할 수 있으니 참고 하시면 좋을 것 같습니다.

url<-"http://finance.naver.com/item/sise_day.nhn?code=005380&page=1" # 종목 A

url<-"http://finance.naver.com/item/sise_day.nhn?code=005930&page=1" # 종목B

library(httr)

referer <- add_headers(Referer = "http://finance.naver.com/item/sise_day.nhn?code=005380&page=11") #검색해서 들어간 것처럼 위장하기위해 header를 붙여준다

tmp <- GET(url, referer) # GET함수를 통해 해당 서버에 통신을 함 뒤에 referer인자가 위장술

ta<-read_html(tmp)%>% html_nodes(xpath = '/html/body/table[1]') %>% html_table()

ta2<-(ta[[1]])

ta2[-c(1,7,8,9,15),]

0

zff

0

코코

안녕하세요.zff 님 올려주신 화면으로는 에러의 원인을 알기 어렵습니다. 다만 url을 잘못 지정한게 아닐까 싶은데

전체코드를 올려주시면 확인해보도록 하겠습니다. 

셀레늄 실습중 문의

0

807

1

ADP 자격증 대비 강의 개설 문의

0

809

2

멜론편 진행하고 있는데 배너 닫는 버튼이 안보이네요.

0

634

2

옵션 선택에 따른 크롤링

0

740

1

셀레니움으로 네이버를 열고나서 갑자기 data;라는 주소로 바뀌고 내용이 사라집니다.

0

1271

2

ImportError: cannot import name 'webdriver' from partially initialized module 'selenium' 에러

0

2222

1

검색어 입력 관련

1

505

3

광고상품 외 표기 문의드립니다.

2

424

2

광고 상품 표기 추가문의

0

270

1

광고상품 표기외에 상품명도 보려고 하는데요. 에러가나네요.

1

446

1

유튜브 크롤링/키워드 별 크롤링 방법에서 에러발생합니다.

1

994

3

질문드립니다.

1

373

2

개발자 모드에서 클래스 항목 갯수 찾는 부분은 어떻게 설정할 수 있나요?

0

588

1

lxml.etree.LxmlSyntaxError: not in an element - 쿠팡결과_엑셀저장

1

581

1

Exception has occurred: SSLError 이런 에러가 발생합니다.

0

1994

1

Exercise 70 질문드립니다.

0

392

1

제발 도와주세요ㅠ

0

477

2

셀레니움 강의 중 문의사항 입니다.

1

322

1

무언가 오류가 있다고 뜨는데 어떻게 고치나요?

1

529

1

안녕하세요. 강의의 미흡한점이 있어 문의드립니다.

1

675

1

크롤링 중에 구글 reCAPTCHA 우회 방법

1

9996

1

get_text(), string

0

363

1

단일 열로 이루어진 데이터의 열이름 변경

0

540

1

거래소 데이터를 R로 불러올때

0

438

1