Làm chủ Crawling bằng cách thực hành cùng Data Workshop
Làm chủ Python Crawling. Chỉ với một nội dung này, bạn có thể nắm bắt từ cài đặt đến ứng dụng thực tế.
Tôi đã gói gọn tất cả những nội dung thực sự cần thiết để bạn có thể áp dụng ngay vào thực tế.
Cảm ơn bạn đã giải thích nó rất dễ dàng.
Thật tuyệt vời cho người mới bắt đầu :)
5.0
이주리애
17% đã tham gia
Cảm ơn bạn vì bài giảng tuyệt vời!
Bạn sẽ nhận được điều này sau khi học.
Chỉ những cú pháp Python thiết yếu, dễ hiểu hơn bất kỳ ai
Tinh hoa của crawling! Kèm theo cả những bí kíp cốt lõi
Không chỉ là những bài giảng chỉ để xem, mà là trực tiếp nhập liệu và thực thi
Điều khiển trình duyệt bằng Selenium
Tìm kiếm thứ bạn muốn trong HTML (feat. BeautifulSoup)
Lưu kết quả crawling thành tệp Excel
So sánh ưu nhược điểm của các phương pháp crawling
Tôi sẽ hướng dẫn bạn bí quyết crawling để có thể thoải mái đánh bắt cá và vui đùa trong biển cả thông tin.
📑 Hãy kiểm tra xem bạn có thuộc trường hợp nào trong danh sách dưới đây không nhé!
✅ Tôi đang trực tiếp chỉnh sửa và xử lý từng công việc lặp đi lặp lại đó mỗi ngày.
✅ Vì mải mê làm các công việc lặp đi lặp lại nên không có thời gian, thậm chí không dám nghĩ đến việc thực hiện các nghiệp vụ phân tích quan trọng.
✅ Tôi muốn thực hiện các công việc như tạo biểu đồ đơn giản, làm PPT đơn thuần và báo cáo một cách hiệu quả.
✅ Cảm thấy chán nản khi phải lặp đi lặp lại vô tận công việc Ctrl + C, Ctrl + V một cách vô thức. from endlessly repeating Ctrl + C and Ctrl + V.
✅ Muốn để máy tính thực hiện công việc, và đầu tư thời gian, tâm huyết cũng như nỗ lực vào những việc thực sự quan trọng.
👉 Nếu bạn thuộc một trong những trường hợp trên, bạn nhất định phải tham gia khóa học này.
Bí quyết crawling để bạn có thể thoải mái đánh bắt cá và vui đùa giữa biển cả thông tin 📑
Dạo này có dữ liệu nào mà không có trên internet không? Không có đâu. Bạn có thể nghĩ rằng chỉ cần lưu lại tất cả tài liệu tìm được rồi sử dụng là xong, nhưng việc đó đâu có dễ dàng? Việc biến những điều không dễ dàng thành có thể, thu thập các thông tin có trên các trang web internet được gọi chính là Crawling. Nếu học được Crawling thì sẽ rất tốt cho việc nâng cao hiệu quả công việc đúng không? Tuy nhiên, có rất nhiều phương pháp Crawling bằng Python. Nếu học tất cả những thứ này thì sẽ rất vất vả và tốn nhiều thời gian. Và thậm chí cũng không có nhiều người biết hết tất cả đâu.
Khóa học này được tôi xây dựng bằng cách chắt lọc kỹ lưỡng từ những gì tôi đã dành nhiều đêm để tìm tòi, thử nghiệm và thực hiện trong thực tế, sau khi đã loại bỏ những thứ không cần thiết hoặc trùng lặp, chỉ giữ lại những lệnh và kỹ thuật cốt lõi thực sự cần thiết. Tôi sẽ không dạy những thứ vụn vặt, mà sẽ chọn lọc và truyền đạt cho các bạn những nội dung trọng tâm nhất.
Tin tưởng và đón xem "Xưởng dữ liệu" 💪
Cho đến nay, vẫn có hơn một nghìn người truy cập blog mỗi ngày để xem các bài viết cơ bản về crawling mà tôi đã viết trên blog từ 3 năm trước.
Kể từ khi viết bài này 3 năm trước, tôi đã thực hiện nhiều dự án khác nhau, kiểm tra các phần Q&A và tiến hành các thử nghiệm mới, nhưng cho đến nay không có phần nào mà những kỹ thuật tôi đã tổng hợp lại không giải quyết được. Mặc dù có rất nhiều thư viện và phương pháp đa dạng đang đổ bộ, nhưng cuối cùng chỉ cần nắm vững những điều cơ bản nhất là bạn có thể ứng dụng vào bất cứ thứ gì. Thay vì chỉ là một phương pháp ngắn hạn để giải quyết duy nhất một vấn đề, tôi muốn hướng dẫn cho bạn những phương pháp có thể áp dụng cho việc này lẫn việc kia, và có thể tiếp tục sử dụng lâu dài về sau.
Đừng để bản thân lạc lối giữa vô vàn các câu lệnh và bài giảng khác nhau, hãy đồng hành cùng "Xưởng dữ liệu (Data Workshop)". Tôi xin giới thiệu những nội dung cốt lõi mà tôi đã tự tin đúc kết dựa trên vô số thử nghiệm và sai sót trong suốt thời gian qua. Nếu bây giờ bạn bỏ qua để đến với bài giảng khác, có thể sau này khi quay lại bạn sẽ phải thốt lên rằng: "A... biết thế lúc đó mình học luôn cho rồi...". Biết thì là kỹ thuật, không biết thì là phép thuật! Nếu bạn học được kỹ thuật đó, cuộc sống của bạn sẽ thực sự trở nên vô cùng thoải mái!
Khóa học này là khóa học như thế nào? 🧐
Đây không phải là một bài giảng chỉ đọc mã nguồn, thực thi rồi cứ thế bỏ qua.
Tôi sẽ trực tiếp gõ phím, giải thích, phân tích và cùng bạn suy ngẫm từng chút một.
Nói cách khác, đây không phải là một bài giảng dễ dàng.
Đây không phải là bài giảng mà bạn chỉ cần ngồi yên chạy thử hay chỉ nghe thôi là được.
Đây là một bài giảng gây khó chịu khi bạn phải liên tục gõ phím và nhập liệu theo suốt quá trình học..
Những gì bạn sẽ học trong khóa học này ✏️
Từ việc cài đặt Python cho đến cách sử dụng Python thiết yếu để thu thập dữ liệu (crawling)
Thông tin trang web hiển thị trước mắt tôi
Kỹ thuật crawling giúp bạn không còn cần đến Ctrl + C, Ctrl + V nữa
Không cần những từ ngữ đao to búa lớn hay những nội dung ít tính ứng dụng!
Chỉ tập trung vào những nội dung cốt lõi có khả năng ứng dụng đến 200%!
Các công cụ được đề cập ở đây 🧰
Cần có máy tính thực hành khi tiến hành bài giảng.
Cài đặt Python 3.x
Cài đặt Jupyter Notebook
Cài đặt trình duyệt Chrome
Cấu hình máy tính không thành vấn đề, miễn là không mất quá 20 phút để khởi động.
Khuyên bạn nên sử dụng Anaconda để cài đặt Python, vui lòng tham khảo tài liệu hướng dẫn cài đặt tại https://m.blog.naver.com/kiddwannabe/221154599192
Câu hỏi thường gặp Q&A 🙋🏻♂️
Q. Người không chuyên có thể học được không? Đây là lần đầu tôi học lập trình.... A. Đây là bài giảng dành cho người không chuyên. Chúng ta sẽ tiến hành từng bước một, bắt đầu từ việc cài đặt chương trình. Tôi đã không ngừng nghỉ cả tay lẫn miệng để truyền đạt những bí quyết riêng của mình trong suốt quá trình học. Tôi khuyên bạn nên xem hết tất cả các video bài giảng mà không bỏ sót video nào.
※ Những người đã am hiểu về lập trình nên nghe với tốc độ nhanh hơn hoặc tham khảo các bài giảng khác.
Q. Những ai nên tham gia khóa học này? ? A. Những người tò mò về việc có thể làm được gì với Python! Những người cảm thấy e ngại vì lần đầu tiên học lập trình! Những người muốn giao việc cho máy tính rồi tan làm sớm!
Q. Điểm khác biệt so với các bài giảng khác là gì? A. Đây không phải là bài giảng chỉ nhìn vào PPT rồi lướt qua! Cũng không phải là bài giảng chỉ đọc lại những đoạn mã đã được nhập sẵn! Đây là bài giảng ứng dụng thực tế, nơi bạn sẽ tự tay nhập từng dòng mã, thực thi, xem lỗi và kiểm tra kết quả.
H. Có file thực hành và tài liệu tóm tắt không? Đ. Để phù hợp nhất với môi trường live-coding, tôi sẽ tiến hành bằng cách tự tay nhập từng dòng mã vào Jupyter Notebook trống, và đối với những phần nhất thiết phải giải thích bằng hình ảnh, tôi sẽ sử dụng các trang slide PPT để giảng dạy.
- 2023.01.31 Đã thêm cách sử dụng mã cập nhật tự động phiên bản trình duyệt Chrome.
Các bài giảng sẽ tiếp tục được bổ sung trong thời gian tới, nếu bạn có bất kỳ yêu cầu hay thắc mắc nào, vui lòng liên hệ qua email datago0ba0@gmail.com. Xin cảm ơn.
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Người mới bắt đầu làm quen với lập trình
Những người muốn thu thập dữ liệu
Dành cho những ai muốn thu thập dữ liệu mạng xã hội (SNS)
Những người nhìn thì hiểu nhưng lại thấy mịt mờ khi tự mình bắt tay vào làm
Tôi muốn chia sẻ tất cả những kinh nghiệm từ nỗ lực, thất bại cho đến thành công của mình để bất kỳ ai cũng có thể học hỏi một cách dễ dàng và áp dụng nhanh chóng.
Bạn cũng có thể xem các bài viết liên quan tại Naver Blog.
Bạn đã hoàn thành bài giảng trong một ngày!
Tôi rất vui vì bạn thấy nó hữu ích. ^^ Cảm ơn bạn đã để lại nhận xét.
Chúng tôi đang chuẩn bị các bài giảng khác, các bạn hãy đón chờ nhé ^^