강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của psh52340557
psh52340557

câu hỏi đã được viết

Thu thập dữ liệu web với R - phiên bản thực tế

Quét cộng đồng 보배드림

readlines. htmltab, readhtmltable 구별해 사용하는 방법?

Viết

·

259

0

크롤링 할때 사이트마다 사용하는 방법이 조금 다른 거 같은데, 사이트 속성을 보고 각각의 함수를 사용하는 기준이 있는지 궁금합니다.

R웹-크롤링

Câu trả lời 2

0

Steady님의 프로필 이미지
Steady
Người đặt câu hỏi

감사합니다!

0

coco님의 프로필 이미지
coco
Người chia sẻ kiến thức

안녕하세요. Steady님

크롤링을 하는 방법에는 해당 사이트가 어떻게 구성이 되어있는지에 따라 다릅니다.

커뮤니티와 같은 사이트는 크롤링하기 쉬운 대표적인 사이트로 일정규칙에 맞게 원하는 곳을 찾아내면 됩니다.

readhtmltable같은 경우는 크롤링 하고자하는 사이트가 table형태일 때 조금 수월하게 크롤링 할 수 있도록 도와주는 함수 입니다.

꼭 readhtmltable이 아니라 readLines를 통해서도 할 수 있지만, 다양한 형태로 크롤링 할 수 있다라는 것을 보여드리고자 하였습니다.

감사합니다. 

Hình ảnh hồ sơ của psh52340557
psh52340557

câu hỏi đã được viết

Đặt câu hỏi