-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
readlines. htmltab, readhtmltable 구별해 사용하는 방법?
20.01.15 16:27 작성 조회수 138
0
크롤링 할때 사이트마다 사용하는 방법이 조금 다른 거 같은데, 사이트 속성을 보고 각각의 함수를 사용하는 기준이 있는지 궁금합니다.
답변을 작성해보세요.
0
0
코코
지식공유자2020.01.15
안녕하세요. Steady님
크롤링을 하는 방법에는 해당 사이트가 어떻게 구성이 되어있는지에 따라 다릅니다.
커뮤니티와 같은 사이트는 크롤링하기 쉬운 대표적인 사이트로 일정규칙에 맞게 원하는 곳을 찾아내면 됩니다.
readhtmltable같은 경우는 크롤링 하고자하는 사이트가 table형태일 때 조금 수월하게 크롤링 할 수 있도록 도와주는 함수 입니다.
꼭 readhtmltable이 아니라 readLines를 통해서도 할 수 있지만, 다양한 형태로 크롤링 할 수 있다라는 것을 보여드리고자 하였습니다.
감사합니다.
답변 2