강의

멘토링

커뮤니티

Data Science

/

Data Analysis

[Phiên bản mới sửa đổi] Đây mới thực sự là Crawling - Phần cơ bản

Dành cho những người lần đầu học crawling, tôi sẽ giải thích một cách ① dễ hiểu nhất và ② tận tình nhất. Crawling thực sự rất thú vị. Tôi sẽ chịu trách nhiệm hướng dẫn, hãy tin tưởng và làm theo tôi nhé.

(4.9) 660 đánh giá

13,558 học viên

Độ khó Cơ bản

Thời gian Không giới hạn

  • startcoding
Python
Python
Web Crawling
Web Crawling
Python
Python
Web Crawling
Web Crawling
Thumbnail

(Tiết lộ khẩn cấp) Đây là Thu thập thông tin thực sự - Thông báo gia hạn quan trọng

Trang web không hoạt động bình thường do cập nhật

Có khó khăn để theo dõi bài giảng vì các ví dụ không?

 

Để giải quyết vấn đề, tất cả các bài giảng hiện có đều bị hủy bỏ.

Nó sẽ được tái sinh hoàn toàn vào tháng 5 năm 2024.

 

Những người bỏ cuộc giữa chừng vì khó khăn,

Những người đã làm theo phương pháp tương tự nhưng không thành công

Lần này sẽ khác.

 

Đây là nội dung tôi tạo ra sau khi suy nghĩ hàng trăm lần.

Nếu bạn làm theo, chắc chắn bạn sẽ giỏi code.


 

Ngày 8 tháng 5 năm 2024

'Đây là Thu thập thông tin thực sự – Cơ bản' được lên kế hoạch gia hạn hoàn toàn.

Vui lòng tham khảo điều này khi giảng bài.

 


 

<Chương trình giảng dạy cơ bản - mới>

 

  • Khái niệm thu thập dữ liệu web và trường hợp sử dụng

  • Tài liệu 1: HTML cơ bản trong 10 phút

  • Tài liệu 2: Cốt lõi của việc thu thập dữ liệu trên web! Nghiên cứu chuyên sâu về bộ chọn CSS

  • Tìm hiểu cách sử dụng thư viện (request, beautifulsoup4)

  • thu thập dữ liệu thực tế

    • Bước 1: Cách thu thập thông tin một sản phẩm

    • Bước 2: Cách thu thập thông tin nhiều sản phẩm <Forest Theory>

    • Bước 3: Cách thu thập dữ liệu nhiều trang

    • Bước 4: Cách lưu dữ liệu đã crawl trong Excel


 

Ngày 15 tháng 5 năm 2024

‘Đây là Thu thập dữ liệu thực sự’ được lên kế hoạch cho lần đổi mới lớn đầu tiên.

Vui lòng tham khảo điều này khi giảng bài.

 


<Chương trình giảng dạy mới>



  • Bộ chọn CSS Kỹ thuật thực hành nâng cao

    • bộ chọn anh chị em

    • bộ chọn loại thứ n

    • bộ chọn thuộc tính

  • Cách tìm thẻ chứa văn bản cụ thể

    • Cách sử dụng tìm, find_all

    • Khái niệm cơ bản về biểu thức chính quy

  • Ví dụ thực tế về thu thập thông tin trang tĩnh

    • Thu thập thông tin tin tức chứng khoán Naver

    • Thu thập thông tin trí tuệ Naver

    • Thu thập dữ liệu giấy RISS

  • Cách sử dụng cơ bản của Selenium

    • Tùy chọn Selenium

    • Quản lý các chức năng của trình duyệt web trong một lần

    • Tìm và kiểm soát các thẻ mong muốn

  • Kỹ thuật thực hành Selenium

    • Kiểm soát đồng thời nhiều thẻ

    • Kỹ thuật xếp hàng động

    • Điều khiển đầu vào nâng cao

    • Cách vận hành hộp chọn

    • Quản lý nhiều trang

      • Khi có một trang khác trong trang (phương pháp kiểm soát iframe) - Naver Mail Automation

      • Phương pháp kiểm soát cửa sổ mới - Tự động hóa chứng khoán Naver Pay

    • Cách xử lý cuộn

  • Cách dễ dàng thu thập dữ liệu các trang động

  • Ví dụ thực tế về thu thập thông tin trang động

    • Thu thập thông tin mua sắm trên Naver

    • Thu thập thông tin quán cà phê Naver

  • Phát triển GUI bằng pyside6 và qt-designer

    • cách sử dụng cơ bản của qt-designer

    • Xử lý các vật dụng pyside6

    • phương pháp xử lý sự kiện pyside6

    • Ví dụ thực tế về phát triển GUI

  • Làm cho nó chạy trên mọi máy tính (tạo tệp exe)


Giảng hàng trăm bài giảng trong ba năm,

Chúng tôi sẽ chia sẻ tất cả bí quyết thu thập thông tin bổ sung mà chúng tôi đã có được.

 

Dễ dàng hơn các bài giảng hiện có,

Nhanh hơn các bài giảng hiện có,

Chúng tôi đã chuẩn bị bài giảng này kỹ lưỡng hơn trước.

Hãy tham gia cùng tôi một lần nữa trên con đường trở thành chuyên gia bò.

 

Cảm ơn bạn đã đọc cho đến cuối cùng.

-Bắt đầu giấc mơ viết mã.

Bình luận

Miễn phí