강의

멘토링

커뮤니티

Data Science

/

Data Analysis

[Phiên bản mới sửa đổi] Đây mới thực sự là Crawling - Phần cơ bản

Dành cho những người lần đầu học crawling, tôi sẽ giải thích một cách ① dễ hiểu nhất và ② tận tình nhất. Crawling thực sự rất thú vị. Tôi sẽ chịu trách nhiệm hướng dẫn, hãy tin tưởng và làm theo tôi nhé.

(4.9) 660 đánh giá

13,556 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

  • startcoding
Python
Python
Web Crawling
Web Crawling
Python
Python
Web Crawling
Web Crawling
Thumbnail

(Thông báo khẩn cấp) Đây là bản thu thập thông tin thực sự - Phiên bản cơ bản đã được đổi mới đáng kể.

Thời gian bạn dành cho việc thu thập dữ liệu lặp đi lặp lại có quá quý giá không?

Bạn có muốn kết thúc việc thu thập dữ liệu gây phiền nhiễu chỉ bằng một cú nhấp chuột?

 

Bạn đã đến đúng nơi.

Bây giờ chúng tôi sẽ giúp bạn tiết kiệm rất nhiều thời gian.

 

Chỉ cần nghe bài giảng này , thời gian thu thập dữ liệu sẽ giảm đi hơn 10 lần.

Những người bỏ cuộc giữa chừng vì khó khăn,

Những người đã làm theo phương pháp tương tự nhưng không thành công

Lần này sẽ khác.

 

Ngày 8 tháng 5 năm 2024

'Đây là Thu thập thông tin thực sự - Cơ bản' đã được đổi mới hoàn toàn.

Chỉ những người thực sự muốn thành công trong lĩnh vực tự động hóa mới nên đến học.

 

 

<Chương trình giảng dạy cơ bản - mới>

 

  • Khái niệm thu thập dữ liệu web và trường hợp sử dụng

  • Tài liệu 1: Hoàn thành kiến ​​thức cơ bản về HTML trong 10 phút

  • Tài liệu 2: Cốt lõi của việc thu thập dữ liệu trên web! Nghiên cứu chuyên sâu về bộ chọn CSS

  • Tìm hiểu cách sử dụng thư viện (request, beautifulsoup4)

  • thu thập dữ liệu thực tế

    • Bước 1: Cách thu thập thông tin một sản phẩm

    • Bước 2: Cách thu thập thông tin nhiều sản phẩm <Forest Theory>

    • Bước 3: Cách thu thập dữ liệu nhiều trang

    • Bước 4: Cách lưu dữ liệu đã crawl trong Excel


 

 

Ngày 15 tháng 5 năm 2024

'Đây là Thu thập thông tin thực - Phiên bản thực tế' được lên kế hoạch cho lần đổi mới lớn đầu tiên.

Vui lòng tham khảo điều này khi giảng bài.

 


<Chương trình giảng dạy mới>



  • Bộ chọn CSS Kỹ thuật thực hành nâng cao

    • bộ chọn anh chị em

    • bộ chọn loại thứ n

    • bộ chọn thuộc tính

  • Cách tìm thẻ chứa văn bản cụ thể

    • Cách sử dụng tìm, find_all

    • Khái niệm cơ bản về biểu thức chính quy

  • Ví dụ thực tế về thu thập thông tin trang tĩnh

    • Thu thập thông tin tin tức chứng khoán Naver

    • Thu thập thông tin trí tuệ Naver

    • Thu thập dữ liệu giấy RISS

  • Cách sử dụng cơ bản của Selenium

    • Tùy chọn Selenium

    • Quản lý các chức năng của trình duyệt web trong một lần

    • Tìm và kiểm soát các thẻ mong muốn

  • Kỹ thuật thực hành Selenium

    • Kiểm soát đồng thời nhiều thẻ

    • Kỹ thuật xếp hàng động

    • Điều khiển đầu vào nâng cao

    • Cách vận hành hộp chọn

    • Quản lý nhiều trang

      • Khi có một trang khác trong trang (phương pháp kiểm soát iframe) - Naver Mail Automation

      • Cách mới để điều khiển cửa sổ

  • Cách dễ dàng thu thập dữ liệu các trang động

    • Thu thập thông tin trang động

    • Cách xử lý cuộn

  • Ví dụ thực tế về thu thập thông tin trang động

    • Thu thập thông tin mua sắm trên Naver

    • Thu thập thông tin quán cà phê Naver

  • Phát triển GUI bằng pyside6 và qt-designer

    • cách sử dụng cơ bản của qt-designer

    • Xử lý các vật dụng pyside6

    • phương pháp xử lý sự kiện pyside6

    • Ví dụ thực tế về phát triển GUI

  • Làm cho nó chạy trên mọi máy tính (tạo tệp exe)

Bình luận

Miễn phí