• 카테고리

    질문 & 답변
  • 세부 분야

    프로그래밍 언어

  • 해결 여부

    미해결

readHTMLTable error

22.04.03 19:12 작성 조회수 162

0

엔제리너스 클롤링 과정 중에 htmltab으로 에러가 나서 XML을 설치한 후에 설치한 후에 for문 안에서 readHTMLTable을 불러 왔습니다. 그런데 이것도 에러가 생겨서 더이상 진행을 하지 못했습니다. 이런 경우 어떤 패키지를 새로 설치해야 하는 건지, 다른 코드를 짜야 하는 건지 궁금합니다.
 
 

답변 1

답변을 작성해보세요.

0

안녕하세요. silver8842님 답변이 늦어서 죄송합니다.

 

readHTMLTable 함수가 현재로서 지원이 안되는 듯 싶습니다.

 

아래와 같은 코드를 통해서 크롤링이 가능하니 참고 부탁드립니다.

 

rvest 패키지를 통해서, html의 상위 노드부터 우리가 원하는 하위 노드까지 찾아가는 구조입니다.

 

library(rvest)

url<-paste0("http://www.angelinus.com/Shop/Shop_Ajax.asp?page=",2)

read_html(url) %>% html_nodes(xpath="/html/body/table")%>% html_nodes("tr") %>% html_nodes("td") %>% html_text()