Làm chủ Crawling bằng cách thực hành cùng Data Workshop

Làm chủ Python Crawling. Chỉ với một nội dung này, bạn có thể nắm bắt từ cài đặt đến ứng dụng thực tế. Tôi đã gói gọn tất cả những nội dung thực sự cần thiết để bạn có thể áp dụng ngay vào thực tế.

(4.7) 6 đánh giá

141 học viên

Độ khó Nhập môn

Thời gian Không giới hạn

Python
Python
Web Crawling
Web Crawling
Big Data
Big Data
Python
Python
Web Crawling
Web Crawling
Big Data
Big Data

Đánh giá từ những học viên đầu tiên

4.7

5.0

dhmin

100% đã tham gia

Đã có thể hiểu crawling dễ dàng hơn.

5.0

김호준

100% đã tham gia

Cảm ơn bạn đã giải thích nó rất dễ dàng. Thật tuyệt vời cho người mới bắt đầu :)

5.0

이주리애

17% đã tham gia

Cảm ơn bạn vì bài giảng tuyệt vời!

Bạn sẽ nhận được điều này sau khi học.

  • Chỉ những cú pháp Python thiết yếu, dễ hiểu hơn bất kỳ ai

  • Tinh hoa của crawling! Kèm theo cả những bí kíp cốt lõi

  • Không chỉ là những bài giảng chỉ để xem, mà là trực tiếp nhập liệu và thực thi

  • Điều khiển trình duyệt bằng Selenium

  • Tìm kiếm thứ bạn muốn trong HTML (feat. BeautifulSoup)

  • Lưu kết quả crawling thành tệp Excel

  • So sánh ưu nhược điểm của các phương pháp crawling

Tôi sẽ hướng dẫn bạn bí quyết crawling để có thể thoải mái đánh bắt cá và vui đùa trong biển cả thông tin.

📑 Hãy kiểm tra xem bạn có thuộc trường hợp nào trong danh sách dưới đây không nhé!

  • ✅ Tôi đang trực tiếp chỉnh sửa và xử lý từng công việc lặp đi lặp lại đó mỗi ngày.
  • ✅ Vì mải mê làm các công việc lặp đi lặp lại nên không có thời gian, thậm chí không dám nghĩ đến việc thực hiện các nghiệp vụ phân tích quan trọng.
  • ✅ Tôi muốn thực hiện các công việc như tạo biểu đồ đơn giản, làm PPT đơn thuần và báo cáo một cách hiệu quả.
  • ✅ Cảm thấy chán nản khi phải lặp đi lặp lại vô tận công việc Ctrl + C, Ctrl + V một cách vô thức. from endlessly repeating Ctrl + C and Ctrl + V.
  • ✅ Muốn để máy tính thực hiện công việc, và đầu tư thời gian, tâm huyết cũng như nỗ lực vào những việc thực sự quan trọng.
  • 👉 Nếu bạn thuộc một trong những trường hợp trên, bạn nhất định phải tham gia khóa học này.

Bí quyết crawling để bạn có thể thoải mái đánh bắt cá và vui đùa giữa biển cả thông tin 📑

Dạo này có dữ liệu nào mà không có trên internet không? Không có đâu. Bạn có thể nghĩ rằng chỉ cần lưu lại tất cả tài liệu tìm được rồi sử dụng là xong, nhưng việc đó đâu có dễ dàng? Việc biến những điều không dễ dàng thành có thể, thu thập các thông tin có trên các trang web internet được gọi chính là Crawling. Nếu học được Crawling thì sẽ rất tốt cho việc nâng cao hiệu quả công việc đúng không? Tuy nhiên, có rất nhiều phương pháp Crawling bằng Python. Nếu học tất cả những thứ này thì sẽ rất vất vả và tốn nhiều thời gian. Và thậm chí cũng không có nhiều người biết hết tất cả đâu.

Khóa học này được tôi xây dựng bằng cách chắt lọc kỹ lưỡng từ những gì tôi đã dành nhiều đêm để tìm tòi, thử nghiệm và thực hiện trong thực tế, sau khi đã loại bỏ những thứ không cần thiết hoặc trùng lặp, chỉ giữ lại những lệnh và kỹ thuật cốt lõi thực sự cần thiết. Tôi sẽ không dạy những thứ vụn vặt, mà sẽ chọn lọc và truyền đạt cho các bạn những nội dung trọng tâm nhất.


Tin tưởng và đón xem "Xưởng dữ liệu" 💪

Cho đến nay, vẫn có hơn một nghìn người truy cập blog mỗi ngày để xem các bài viết cơ bản về crawling mà tôi đã viết trên blog từ 3 năm trước.

📗Naver Blog "데이터공방" (Xưởng dữ liệu)

<Marketer không biết code cũng có thể crawling #4. Lấy thông tin bằng BeautifulSoup>
Lượt xem tích lũy 44 nghìn lượt, tính đến ngày 14.01.2021 -

Kể từ khi viết bài này 3 năm trước, tôi đã thực hiện nhiều dự án khác nhau, kiểm tra các phần Q&A và tiến hành các thử nghiệm mới, nhưng cho đến nay không có phần nào mà những kỹ thuật tôi đã tổng hợp lại không giải quyết được. Mặc dù có rất nhiều thư viện và phương pháp đa dạng đang đổ bộ, nhưng cuối cùng chỉ cần nắm vững những điều cơ bản nhất là bạn có thể ứng dụng vào bất cứ thứ gì. Thay vì chỉ là một phương pháp ngắn hạn để giải quyết duy nhất một vấn đề, tôi muốn hướng dẫn cho bạn những phương pháp có thể áp dụng cho việc này lẫn việc kia, và có thể tiếp tục sử dụng lâu dài về sau.

Đừng để bản thân lạc lối giữa vô vàn các câu lệnh và bài giảng khác nhau, hãy đồng hành cùng "Xưởng dữ liệu (Data Workshop)". Tôi xin giới thiệu những nội dung cốt lõi mà tôi đã tự tin đúc kết dựa trên vô số thử nghiệm và sai sót trong suốt thời gian qua. Nếu bây giờ bạn bỏ qua để đến với bài giảng khác, có thể sau này khi quay lại bạn sẽ phải thốt lên rằng: "A... biết thế lúc đó mình học luôn cho rồi...". Biết thì là kỹ thuật, không biết thì là phép thuật! Nếu bạn học được kỹ thuật đó, cuộc sống của bạn sẽ thực sự trở nên vô cùng thoải mái!


Khóa học này là khóa học như thế nào? 🧐

  • Đây không phải là một bài giảng chỉ đọc mã nguồn, thực thi rồi cứ thế bỏ qua.
  • Tôi sẽ trực tiếp gõ phím, giải thích, phân tích và cùng bạn suy ngẫm từng chút một.
  • Nói cách khác, đây không phải là một bài giảng dễ dàng.
  • Đây không phải là bài giảng mà bạn chỉ cần ngồi yên chạy thử hay chỉ nghe thôi là được.
  • Đây là một bài giảng gây khó chịu khi bạn phải liên tục gõ phím và nhập liệu theo suốt quá trình học..

Những gì bạn sẽ học trong khóa học này ✏️

  • Từ việc cài đặt Python cho đến cách sử dụng Python thiết yếu để thu thập dữ liệu (crawling)
  • Thông tin trang web hiển thị trước mắt tôi
  • Kỹ thuật crawling giúp bạn không còn cần đến Ctrl + C, Ctrl + V nữa
  • Không cần những từ ngữ đao to búa lớn hay những nội dung ít tính ứng dụng!
  • Chỉ tập trung vào những nội dung cốt lõi có khả năng ứng dụng đến 200%!

Các công cụ được đề cập ở đây 🧰

Cần có máy tính thực hành khi tiến hành bài giảng.

  • Cài đặt Python 3.x
  • Cài đặt Jupyter Notebook
  • Cài đặt trình duyệt Chrome

Cấu hình máy tính không thành vấn đề, miễn là không mất quá 20 phút để khởi động.

Khuyên bạn nên sử dụng Anaconda để cài đặt Python, vui lòng tham khảo tài liệu hướng dẫn cài đặt tại https://m.blog.naver.com/kiddwannabe/221154599192


Câu hỏi thường gặp Q&A 🙋🏻‍♂️

Q. Người không chuyên có thể học được không? Đây là lần đầu tôi học lập trình.... 
A. Đây là bài giảng dành cho người không chuyên. Chúng ta sẽ tiến hành từng bước một, bắt đầu từ việc cài đặt chương trình. Tôi đã không ngừng nghỉ cả tay lẫn miệng để truyền đạt những bí quyết riêng của mình trong suốt quá trình học. Tôi khuyên bạn nên xem hết tất cả các video bài giảng mà không bỏ sót video nào.

※ Những người đã am hiểu về lập trình nên nghe với tốc độ nhanh hơn hoặc tham khảo các bài giảng khác.

Q. Những ai nên tham gia khóa học này? ? 
A. Những người tò mò về việc có thể làm được gì với Python!
   Những người cảm thấy e ngại vì lần đầu tiên học lập trình!
   Những người muốn giao việc cho máy tính rồi tan làm sớm!

Q. Điểm khác biệt so với các bài giảng khác là gì?
A. Đây không phải là bài giảng chỉ nhìn vào PPT rồi lướt qua!
Cũng không phải là bài giảng chỉ đọc lại những đoạn mã đã được nhập sẵn!
Đây là bài giảng ứng dụng thực tế, nơi bạn sẽ tự tay nhập từng dòng mã, thực thi, xem lỗi và kiểm tra kết quả.

H. Có file thực hành và tài liệu tóm tắt không?
Đ. Để phù hợp nhất với môi trường live-coding, tôi sẽ tiến hành bằng cách tự tay nhập từng dòng mã vào Jupyter Notebook trống, và đối với những phần nhất thiết phải giải thích bằng hình ảnh, tôi sẽ sử dụng các trang slide PPT để giảng dạy.

[updated]
- 2021.02.17. Đã thêm nội dung thu thập dữ liệu (crawling) Instagram
- 2021.05.06  Đã thêm nội dung thu thập dữ liệu (crawling) YouTube.

- 2023.01.31  Đã thêm cách sử dụng mã cập nhật tự động phiên bản trình duyệt Chrome.

 

Các bài giảng sẽ tiếp tục được bổ sung trong thời gian tới,
nếu bạn có bất kỳ yêu cầu hay thắc mắc nào, vui lòng liên hệ qua email datago0ba0@gmail.com. Xin cảm ơn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới bắt đầu làm quen với lập trình

  • Những người muốn thu thập dữ liệu

  • Dành cho những ai muốn thu thập dữ liệu mạng xã hội (SNS)

  • Những người nhìn thì hiểu nhưng lại thấy mịt mờ khi tự mình bắt tay vào làm

Cần biết trước khi bắt đầu?

  • Gõ bàn phím tiếng Anh không cần nhìn phím

Xin chào
Đây là datago0ba0

141

Học viên

6

Đánh giá

4

Trả lời

4.7

Xếp hạng

1

Khóa học

Xin chào, đây là Xưởng Dữ Liệu (Data Workshop).

Tôi muốn chia sẻ tất cả những kinh nghiệm từ nỗ lực, thất bại cho đến thành công của mình để bất kỳ ai cũng có thể học hỏi một cách dễ dàng và áp dụng nhanh chóng.

Bạn cũng có thể xem các bài viết liên quan tại Naver Blog .

 

Đi đến xem blog

Gửi email liên hệ

Thêm

Chương trình giảng dạy

Tất cả

48 bài giảng ∙ (11giờ 11phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

6 đánh giá

4.7

6 đánh giá

  • success1008040님의 프로필 이미지
    success1008040

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Cảm ơn bạn đã giải thích nó rất dễ dàng. Thật tuyệt vời cho người mới bắt đầu :)

    • dhmin5039님의 프로필 이미지
      dhmin5039

      Đánh giá 9

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      Đã có thể hiểu crawling dễ dàng hơn.

      • wnfldo74740831님의 프로필 이미지
        wnfldo74740831

        Đánh giá 1

        Đánh giá trung bình 5.0

        5

        17% đã tham gia

        Cảm ơn bạn vì bài giảng tuyệt vời!

        • datago0ba0
          Giảng viên

          Bạn đã hoàn thành bài giảng trong một ngày! Tôi rất vui vì bạn thấy nó hữu ích. ^^ Cảm ơn bạn đã để lại nhận xét. Chúng tôi đang chuẩn bị các bài giảng khác, các bạn hãy đón chờ nhé ^^

      • kki85083144님의 프로필 이미지
        kki85083144

        Đánh giá 1

        Đánh giá trung bình 4.0

        4

        100% đã tham gia

        Thật dễ dàng để làm theo và học từng cái một.

        • datago0ba0
          Giảng viên

          Cảm ơn bạn đã để lại đánh giá. Tôi hy vọng mọi thứ sẽ diễn ra tốt đẹp trong tương lai. Chúc bạn hôm nay cũng là một ngày tốt lành

      • abcd123123님의 프로필 이미지
        abcd123123

        Đánh giá 330

        Đánh giá trung bình 5.0

        5

        8% đã tham gia

        Khóa học tương tự

        Khám phá các khóa học khác trong cùng lĩnh vực!