Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Analysis

Crawling Master với Data Workshop để học bằng cách làm theo

Bậc thầy thu thập dữ liệu Python. Với cái này, bạn có thể chuyển từ cài đặt sang ứng dụng cùng một lúc. Tôi chỉ bao gồm những thông tin thực sự cần thiết để sử dụng nó.

(4.6) 5 đánh giá

130 học viên

  • datago0ba0
Python
Web Crawling
Big Data

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Chỉ có ngữ pháp Python thiết yếu, dễ hơn bất kỳ phần mềm nào khác

  • Bản chất của việc bò! Ngay cả những lời khuyên quan trọng

  • Đó không phải là bài giảng bạn chỉ xem mà là bài giảng bạn nhập và chạy trực tiếp.

  • Thao tác trình duyệt bằng selen

  • Tìm những gì bạn muốn trong HTML (feat.BeautifulSoup)

  • Lưu kết quả thu thập thông tin dưới dạng tệp Excel

  • So sánh ưu và nhược điểm của phương pháp thu thập thông tin

Chúng tôi sẽ dạy bạn cách bắt cá và bơi trong biển thông tin một cách thoải mái.

📑 Hãy kiểm tra xem có mục nào trong danh sách dưới đây áp dụng cho bạn không!

  • ✅ Tôi đích thân chỉnh sửa và kiểm tra từng nhiệm vụ lặp lại mỗi ngày.
  • ✅ Tôi không có thời gian để làm những công việc lặp đi lặp lại, nên tôi thậm chí không thể nghĩ đến việc thực hiện công việc phân tích quan trọng.
  • ✅ Tôi muốn tạo biểu đồ đơn giản, PPT đơn giản và báo cáo một cách hiệu quả.
  • Tôi cảm thấy tội lỗi khi phải liên tục nhấn Ctrl + C và Ctrl + V.
  • ✅ Tôi muốn để máy tính làm việc và đầu tư thời gian, năng lượng và công sức của mình vào những gì thực sự quan trọng.
  • 👉 Nếu bạn gặp phải một hoặc nhiều trường hợp sau, bạn nên tham gia khóa học này.

Mẹo nhỏ để bắt cá và tung tăng trong đại dương thông tin 📑

Ngày nay, có dữ liệu nào không có sẵn trên internet không? Không hề. Thật tuyệt khi lưu trữ và sử dụng tất cả dữ liệu bạn tìm thấy, nhưng liệu điều đó có dễ dàng không? Việc biến điều khó khăn thành có thể - thu thập thông tin từ các trang web - được gọi là thu thập dữ liệu (crawling) . Học thu thập dữ liệu sẽ là một cách tuyệt vời để cải thiện hiệu quả công việc, phải không? Tuy nhiên, có rất nhiều phương pháp thu thập dữ liệu trong Python. Học tất cả chúng sẽ rất tẻ nhạt và tốn thời gian. Và không nhiều người biết hết tất cả.

Khóa học này là tổng hợp những gì tôi đã dành cả đêm để nghiên cứu, thử nghiệm và triển khai. Tôi đã loại bỏ những thông tin không cần thiết và dư thừa, chỉ chọn lọc những lệnh và kỹ thuật thiết yếu còn sót lại. Tôi sẽ hướng dẫn bạn những điều cơ bản, không đi sâu vào chi tiết.


"Data Workshop" mà bạn có thể tin tưởng và theo dõi 💪

Hơn một nghìn người vẫn truy cập blog của tôi mỗi ngày để đọc những bài viết như bài viết cơ bản về thu thập thông tin mà tôi đã viết cách đây ba năm.

📗Blog Naver "Hội thảo dữ liệu"

< Ngay cả một nhà tiếp thị không biết cách thu thập thông tin #4. Lấy thông tin với BeautifulSoup >
Tổng lượt xem: 44.000, tính đến ngày 14 tháng 1 năm 2021 -

Kể từ khi viết bài viết này ba năm trước, tôi đã tham gia nhiều dự án, xem xét các câu hỏi và trả lời, và thử nghiệm các dự án mới. Cho đến nay, tôi chưa bao giờ gặp vấn đề gì với các kỹ thuật mình đã biên soạn. Mặc dù có rất nhiều thư viện và phương pháp khác nhau đang xuất hiện, nhưng nếu bạn nắm vững những phương pháp cơ bản nhất, bạn có thể áp dụng chúng vào bất cứ điều gì . Tôi không đưa ra các giải pháp ngắn hạn, mà các phương pháp có thể được sử dụng theo nhiều cách khác nhau và có thể được sử dụng trong nhiều năm tới .

Đừng lạc lối giữa muôn vàn câu lệnh và bài giảng. Hãy tham gia "Data Workshop". Tôi sẽ giới thiệu những khái niệm cốt lõi mà tôi đã dày công biên soạn qua vô số lần thử nghiệm và sai sót. Nếu bây giờ bạn bỏ qua bài giảng khác, bạn sẽ quay lại và thốt lên: "À... đáng lẽ mình nên nghe bài đó ngay từ đầu..." Biết rằng đó là một kỹ năng, chứ không phải là một kỹ năng! Học kỹ năng này sẽ giúp cuộc sống của bạn thực sự thoải mái!


Đây là bài giảng gì vậy? 🧐

  • Đây không phải là bài giảng mà bạn chỉ cần đọc mã, chạy nó và tiếp tục.
  • Chúng tôi tự mình gõ ra từng câu, giải thích, diễn giải và cùng nhau suy nghĩ về nó .
  • Nói cách khác, đây không phải là một bài giảng dễ dàng.
  • Đây không phải là bài giảng mà bạn có thể ngồi xuống làm bài tập hoặc chỉ lắng nghe.
  • Đây là một bài giảng khó chịu đòi hỏi bạn phải liên tục gõ và theo dõi .

Những gì bạn sẽ học được trong khóa học này ✏️

  • Từ cài đặt Python đến sử dụng Python cần thiết cho việc thu thập thông tin
  • Thông tin trang web có thể nhìn thấy bằng mắt tôi
  • Công nghệ thu thập dữ liệu giúp loại bỏ nhu cầu sử dụng Ctrl + C và Ctrl + V
  • Không có từ ngữ không cần thiết hoặc từ ngữ có vẻ thừa thãi hoặc nội dung không hữu ích!
  • Chính xác! Chỉ những thứ thiết yếu mới có thể tận dụng được 200%!

Các công cụ được đề cập ở đây 🧰

Cần có máy tính để thực hành trong buổi thuyết trình.

  • Cài đặt Python 3.x
  • Cài đặt Jupyter Notebook
  • Cài đặt trình duyệt Chrome

Cấu hình máy tính của bạn sẽ ổn miễn là thời gian khởi động không quá 20 phút.

Chúng tôi khuyên bạn nên sử dụng Anaconda để cài đặt Python. Vui lòng tham khảo hướng dẫn cài đặt tại https://m.blog.naver.com/kiddwannabe/221154599192


Câu hỏi dự kiến Hỏi & Đáp 🙋🏻‍♂️

H. Người không chuyên ngành có thể tham gia khóa học này không? Tôi mới học lập trình...
A. Khóa học này dành cho sinh viên không chuyên ngành. Chúng tôi sẽ hướng dẫn bạn từng bước, bắt đầu từ việc cài đặt chương trình. Tôi sẽ liên tục chia sẻ các mẹo và thủ thuật của mình. Tôi khuyên bạn nên xem hết tất cả các video bài giảng mà không bỏ sót một video nào.

※ Nếu bạn quen thuộc với lập trình, chúng tôi khuyên bạn nên nghe ở tốc độ nhanh hơn hoặc tham gia các bài giảng khác.

H. Ai sẽ được lợi khi lắng nghe điều này?
A. Có ai tò mò về những gì họ có thể làm với Python không!
Bạn có sợ vì đây là lần đầu tiên bạn lập trình không?
Bất kỳ ai muốn giao công việc cho máy tính!

H. Sự khác biệt so với các bài giảng khác là gì?
A. Đây không phải là bài giảng mà bạn chỉ cần nhìn vào PPT!
Đây không phải là bài giảng chỉ đọc mã bạn đã nhập!
Đây là bài giảng thực hành , trong đó bạn sẽ nhập và thực hiện từng lệnh, kiểm tra lỗi và xem xét kết quả.

H. Có tài liệu thực hành và tài liệu nào được sắp xếp hợp lý không?
A. Chúng ta sẽ tiến hành bằng cách nhập từng phần vào sổ tay Jupyter trống sao cho phù hợp với môi trường lập trình trực tiếp nhất có thể và chúng ta sẽ tiến hành bài giảng bằng cách sử dụng sơ đồ PPT cho những phần thực sự cần giải thích bằng hình ảnh.

[đã cập nhật]
- 17/02/2021. Đã thêm tính năng thu thập dữ liệu Instagram.
- 06/05/2021 Đã thêm tính năng thu thập thông tin trên YouTube.

- 31/01/2023 Đã thêm phương pháp sử dụng mã cập nhật tự động cho phiên bản trình duyệt Chrome.

Các bài giảng sẽ được bổ sung liên tục,
Nếu bạn có bất kỳ yêu cầu hoặc thắc mắc nào, vui lòng liên hệ với chúng tôi qua email datago0ba0@gmail.com. Xin cảm ơn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Bất cứ ai mới học lập trình

  • Bất cứ ai muốn thu thập dữ liệu

  • Bất cứ ai muốn thu thập dữ liệu SNS

  • Bạn nhìn thấy sẽ hiểu, nhưng bạn quá lười để tự mình làm điều đó.

Cần biết trước khi bắt đầu?

  • Đánh máy không cần nhìn bàn phím tiếng Anh

Xin chào
Đây là

130

Học viên

5

Đánh giá

4

Trả lời

4.6

Xếp hạng

1

Khóa học

안녕하세요 데이터 공방 입니다. 

누구나 쉽게 배우고, 빠르게 활용 가능하도록 제가 노력하고, 실패하고, 성공했던 모든 경험들을 나누고자 합니다. 

네이버 블로그 <데이터공방> 에서도 관련 글들을 보실 수 있습니다. 

 

 블로그 보러 가기

 문의 메일 보내기

Chương trình giảng dạy

Tất cả

48 bài giảng ∙ (11giờ 11phút)

Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

5 đánh giá

4.6

5 đánh giá

  • 민석띠ᄒ님의 프로필 이미지
    민석띠ᄒ

    Đánh giá 1

    Đánh giá trung bình 4.0

    4

    100% đã tham gia

    좋은 강의 감사합니다!

    • 데이터공방
      Giảng viên

      수강평 남겨주셔서 감사합니다. 도움이 좀 되셨으면 좋겠네요

  • 이주리애님의 프로필 이미지
    이주리애

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    17% đã tham gia

    좋은 강의 감사합니다!

    • 데이터공방
      Giảng viên

      하루만에 강의를 끝내버리셨네요! 도움이 되셨다니 다행입니다. ^^ 댓글 남겨주셔서 고맙습니다. 다른 강의들도 준비하고 있으니 기대해주세요 ^^

  • dhmin님의 프로필 이미지
    dhmin

    Đánh giá 9

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    크롤링을 보다 쉽게 알 수 있었어요

    • 김호준님의 프로필 이미지
      김호준

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      정말 쉽게쉽게 설명해주셔서 초입자 입장에서 너무 좋습니다:)

      • 김광일님의 프로필 이미지
        김광일

        Đánh giá 1

        Đánh giá trung bình 4.0

        4

        100% đã tham gia

        무난하게 하나씩 따라하며 배우기 좋습니다

        • 데이터공방
          Giảng viên

          수강평 남겨주셔서 감사합니다. 이후에도 원하시는 부분 잘 진행되길 바라겠습니다. 오늘도 좋은 하루 보내세요

      4.601.090 ₫

      Khóa học tương tự

      Khám phá các khóa học khác trong cùng lĩnh vực!