• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

readlines. htmltab, readhtmltable 구별해 사용하는 방법?

20.01.15 16:27 작성 조회수 138

0

크롤링 할때 사이트마다 사용하는 방법이 조금 다른 거 같은데, 사이트 속성을 보고 각각의 함수를 사용하는 기준이 있는지 궁금합니다.

답변 2

·

답변을 작성해보세요.

0

Steady님의 프로필

Steady

질문자

2020.01.16

감사합니다!

0

안녕하세요. Steady님

크롤링을 하는 방법에는 해당 사이트가 어떻게 구성이 되어있는지에 따라 다릅니다.

커뮤니티와 같은 사이트는 크롤링하기 쉬운 대표적인 사이트로 일정규칙에 맞게 원하는 곳을 찾아내면 됩니다.

readhtmltable같은 경우는 크롤링 하고자하는 사이트가 table형태일 때 조금 수월하게 크롤링 할 수 있도록 도와주는 함수 입니다.

꼭 readhtmltable이 아니라 readLines를 통해서도 할 수 있지만, 다양한 형태로 크롤링 할 수 있다라는 것을 보여드리고자 하였습니다.

감사합니다.