• 카테고리

    질문 & 답변
  • 세부 분야

    프로그래밍 언어

  • 해결 여부

    미해결

readHTMLTable이 안되서..ㅠ

21.02.01 20:17 작성 조회수 186

0

readHTMLTable이 안되서 다르게 했는데 1 페이지는 잘 됐습니다. 근데 2 페이지부터 안되네요..ㅠ 무엇이 문제인가요?ㅠㅠ

답변 2

·

답변을 작성해보세요.

0

zff님의 프로필

zff

질문자

2021.02.04

감사합니다! 벡터로 나와서 당황했지만 matrix로 잘 해결했습니다. 

0

안녕하세요. zff 님

현재 엔제리너스 사이트는 기존의방식으로 크롤링이 불가능해보입니다.

readLines를 활용해서 규칙을 찾아서 수집하던가 아니면 아래와 같이 태그를 더 세분화해서 크롤링하는 수 밖에 없을 것 같습니다.

url<-paste0("http://www.angelinus.com/Shop/Shop_Ajax.asp?page=",2)

 read_html(url) %>% html_nodes(xpath="/html/body/table")%>% html_nodes("tr") %>% html_nodes("td") %>% html_te