인프런 커뮤니티 질문&답변

zff님의 프로필 이미지
zff

작성한 질문수

R로 하는 웹 크롤링 - 입문편

엔제리너스 매장 리스트 크롤링

readHTMLTable이 안되서..ㅠ

작성

·

273

0

readHTMLTable이 안되서 다르게 했는데 1 페이지는 잘 됐습니다. 근데 2 페이지부터 안되네요..ㅠ 무엇이 문제인가요?ㅠㅠ

답변 2

0

zff님의 프로필 이미지
zff
질문자

감사합니다! 벡터로 나와서 당황했지만 matrix로 잘 해결했습니다. 

0

코코님의 프로필 이미지
코코
지식공유자

안녕하세요. zff 님

현재 엔제리너스 사이트는 기존의방식으로 크롤링이 불가능해보입니다.

readLines를 활용해서 규칙을 찾아서 수집하던가 아니면 아래와 같이 태그를 더 세분화해서 크롤링하는 수 밖에 없을 것 같습니다.

url<-paste0("http://www.angelinus.com/Shop/Shop_Ajax.asp?page=",2)

 read_html(url) %>% html_nodes(xpath="/html/body/table")%>% html_nodes("tr") %>% html_nodes("td") %>% html_te

zff님의 프로필 이미지
zff

작성한 질문수

질문하기