inflearn logo

Kỹ thuật thu thập dữ liệu web sử dụng trong thực tế (Web Crawling)

Giải thích các kỹ thuật thu thập dữ liệu web bằng Python. Giải thích việc quét dữ liệu web (web scraping) bằng các công nghệ mới nhất.

(5.0) 1 đánh giá

47 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

Web Crawling
Web Crawling
Web Scraping
Web Scraping
browser-automation
browser-automation
Selenium
Selenium
Beautifulsoup
Beautifulsoup
Web Crawling
Web Crawling
Web Scraping
Web Scraping
browser-automation
browser-automation
Selenium
Selenium
Beautifulsoup
Beautifulsoup

Bạn sẽ nhận được điều này sau khi học.

  • Thu thập dữ liệu web

  • Thu thập dữ liệu theo phương thức đồng bộ và bất đồng bộ

  • Tự động hóa trình duyệt

  • Thu thập dữ liệu đa phương tiện

  • Thu thập dữ liệu web

Hãy thu thập và tận dụng dữ liệu web.

Việc thu thập và sử dụng dữ liệu web không chỉ dành riêng cho các nhà khoa học dữ liệu hay chuyên gia trí tuệ nhân tạo. Bất kỳ ai cũng có thể thu thập và sử dụng dữ liệu web.


Đặc điểm của bài giảng này

📌 Giải thích về kỹ thuật thu thập dữ liệu web (Web Crawling, Web Scraping).

📌 Giải thích các kỹ thuật thu thập dữ liệu web mới nhất. Beautifulsoup để phân tích cú pháp trang web và thu thập các yếu tố bạn muốn.

📌 Bạn có thể thu thập dữ liệu không chỉ từ các trang web đồng bộ mà còn từ các trang web bất đồng bộ (asynchronous).

📌 Bạn có thể sử dụng Selenium để tự động hóa trình duyệt (browser-automation).

📌 Cung cấp đa dạng các ví dụ thực hành. Bạn có thể thu thập thêm nhiều dữ liệu web bằng cách ứng dụng các ví dụ thực hành này.

📌 Nội dung của khóa học này là về thu thập dữ liệu web (web crawling), nhưng nói một cách chính xác hơn thì gọi là trích xuất dữ liệu web (web scraping) mới đúng. Tuy nhiên, vì từ "web crawling" quen thuộc với mọi người hơn là "web scraping", nên tôi đã đặt tiêu đề cho khóa học này là web crawling.

  • Vào ngày 12.03.2025, mã thực hành thu thập dữ liệu từ Nara Marketplace đã được sửa đổi.

Dành cho những người sau đây

Tôi muốn xử lý dữ liệu.

Thu thập dữ liệu web là một kỹ năng mà những người làm việc với dữ liệu cần phải có vào bất cứ lúc nào.

Tôi đang tìm việc làm với tư cách là một chuyên gia dữ liệu.
Khám phá và tiền xử lý dữ liệu là những nội dung mà các chuyên gia phân tích dữ liệu hoặc trí tuệ nhân tạo nhất định phải học.

Giảng viên có đáng tin cậy không?
Kỹ sư, giáo viên đào tạo nghề, bằng tiến sĩ, 20 năm kinh nghiệm giảng dạy, chứng chỉ giáo viên đào tạo ngôi sao, tất cả những điều này chứng minh đây là một giảng viên hạng S vượt xa cả hạng A.

💡 Khóa học này là...

  • Giải thích các kỹ thuật thu thập dữ liệu web mới nhất hiện nay.


  • Bạn sẽ học các kỹ thuật có thể thu thập tất cả dữ liệu web bằng cách sử dụng đồng bộ, bất đồng bộ và tự động hóa trình duyệt web.

  • Cung cấp toàn bộ mã nguồn được sử dụng trong bài giảng.


Lưu ý trước khi khóa học bắt đầu

Môi trường thực hành

  • Bài giảng được giải thích dựa trên hệ điều hành Windows.

  • Trong bài giảng, chúng tôi sử dụng trình thông dịch Python và công cụ phát triển PyCharm.


Tài liệu học tập

  • Mã nguồn sẽ được công khai thông qua ghi chú bài học của từng chương.


Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người muốn thu thập và sử dụng dữ liệu web

  • Nhà phân tích dữ liệu

Cần biết trước khi bắt đầu?

  • python

Xin chào
Đây là javaspecialist

1,213

Học viên

91

Đánh giá

10

Trả lời

4.8

Xếp hạng

8

Các khóa học

Nhóm chuyên gia Java (JavaSpecialist.co.kr) hỗ trợ sự phát triển của trí tuệ nhân tạo.

Đánh giá

Tất cả

1 đánh giá

5.0

1 đánh giá

  • javaspecialist님의 프로필 이미지
    javaspecialist

    Đánh giá 8

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Bạn có thể tìm hiểu các công nghệ dữ liệu web được sử dụng trong thực tế. Khóa học này sẽ giúp bạn thu thập dữ liệu từ các trang web xử lý các yêu cầu đồng bộ và không đồng bộ.

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!

    Giảm 25% cho thành viên mới

    783.857 ₫

    25%

    1.045.147 ₫