Làm chủ Crawling bằng cách thực hành cùng Data Workshop
Làm chủ Python Crawling. Chỉ với một nội dung này, bạn có thể nắm bắt từ cài đặt đến ứng dụng thực tế. Tôi đã gói gọn tất cả những nội dung thực sự cần thiết để bạn có thể áp dụng ngay vào thực tế.
141 học viên
Độ khó Nhập môn
Thời gian Không giới hạn
Cập nhật thu thập thông tin nhận xét trên YouTube
Chúng tôi muốn thông báo cho bạn về những thay đổi đối với việc thu thập nhận xét trên YouTube.
Khi thu thập nhận xét trên YouTube, logic sau hiện đang được sử dụng.
1. Lấy tổng số bình luận trên YouTube
2. Cuộn xuống các bình luận khi đạt số lần tối đa (500) → dừng khi đủ số lượng bình luận.
Tổng số bình luận được lấy ra đầu tiên chỉ là số lượng bình luận,
Đã xảy ra sự cố với số lượng nhận xét được thu thập bên dưới, trong đó chỉ tính các nhận xét chung.
Có hai cách để truy cập nó.
1. Cách lấy tất cả các bình luận chính và đếm chúng theo số
Trong trường hợp này, bạn có thể thu thập thông tin trả lời bằng cách nhấp vào nút “Xem câu trả lời” từng cái một.
Nếu làm như vậy sẽ mất thời gian click từng cái một và chờ kết quả, đồng nghĩa với việc thu thập một lượng lớn dữ liệu.
Phải mất nhiều thời gian hơn.
2. Cuộn xuống các bình luận và dừng lại khi không có sự khác biệt so với số lượng bình luận hiện có.
Khi bạn cuộn xuống, hãy tiếp tục so sánh số lượng bình luận với số lượng bạn đã sắp xếp trước đó.
Nếu số lượng bình luận không tăng kể cả khi kéo xuống thì coi như đã hoàn thành. Mục đích là để dừng quá trình này.
Cả hai phương pháp đều có ưu và nhược điểm, nhưng tôi nghĩ phương pháp thứ hai sạch hơn.
Tôi sẽ hướng dẫn bạn thực hiện phương pháp này.
Chúng tôi sẽ tải dữ liệu mã lên bài đăng tài liệu bài giảng liên quan (Phần 5, Thu thập Nhận xét YouTube 2).




