
웹크롤링 with 파이썬
쌤즈(SSAMZ)
파이썬 기반의 웹 크롤링 기술을 습득하여, 웹 페이지로부터 데이터를 수집하고, 이를 바탕으로 업무에서 데이터 수집과 분석 능력을 향상시키기 위한 과정입니다.
초급
Python, 웹 크롤링, Selenium
Bậc thầy thu thập dữ liệu Python. Với cái này, bạn có thể chuyển từ cài đặt sang ứng dụng cùng một lúc. Tôi chỉ bao gồm những thông tin thực sự cần thiết để sử dụng nó.
Chỉ có ngữ pháp Python thiết yếu, dễ hơn bất kỳ phần mềm nào khác
Bản chất của việc bò! Ngay cả những lời khuyên quan trọng
Đó không phải là bài giảng bạn chỉ xem mà là bài giảng bạn nhập và chạy trực tiếp.
Thao tác trình duyệt bằng selen
Tìm những gì bạn muốn trong HTML (feat.BeautifulSoup)
Lưu kết quả thu thập thông tin dưới dạng tệp Excel
So sánh ưu và nhược điểm của phương pháp thu thập thông tin
Chúng tôi sẽ dạy bạn cách bắt cá và bơi trong biển thông tin một cách thoải mái.
Ngày nay, có dữ liệu nào không có sẵn trên internet không? Không hề. Thật tuyệt khi lưu trữ và sử dụng tất cả dữ liệu bạn tìm thấy, nhưng liệu điều đó có dễ dàng không? Việc biến điều khó khăn thành có thể - thu thập thông tin từ các trang web - được gọi là thu thập dữ liệu (crawling) . Học thu thập dữ liệu sẽ là một cách tuyệt vời để cải thiện hiệu quả công việc, phải không? Tuy nhiên, có rất nhiều phương pháp thu thập dữ liệu trong Python. Học tất cả chúng sẽ rất tẻ nhạt và tốn thời gian. Và không nhiều người biết hết tất cả.
Khóa học này là tổng hợp những gì tôi đã dành cả đêm để nghiên cứu, thử nghiệm và triển khai. Tôi đã loại bỏ những thông tin không cần thiết và dư thừa, chỉ chọn lọc những lệnh và kỹ thuật thiết yếu còn sót lại. Tôi sẽ hướng dẫn bạn những điều cơ bản, không đi sâu vào chi tiết.
Hơn một nghìn người vẫn truy cập blog của tôi mỗi ngày để đọc những bài viết như bài viết cơ bản về thu thập thông tin mà tôi đã viết cách đây ba năm.
< Ngay cả một nhà tiếp thị không biết cách thu thập thông tin #4. Lấy thông tin với BeautifulSoup >
Tổng lượt xem: 44.000, tính đến ngày 14 tháng 1 năm 2021 -
Kể từ khi viết bài viết này ba năm trước, tôi đã tham gia nhiều dự án, xem xét các câu hỏi và trả lời, và thử nghiệm các dự án mới. Cho đến nay, tôi chưa bao giờ gặp vấn đề gì với các kỹ thuật mình đã biên soạn. Mặc dù có rất nhiều thư viện và phương pháp khác nhau đang xuất hiện, nhưng nếu bạn nắm vững những phương pháp cơ bản nhất, bạn có thể áp dụng chúng vào bất cứ điều gì . Tôi không đưa ra các giải pháp ngắn hạn, mà là các phương pháp có thể được sử dụng theo nhiều cách khác nhau và có thể được sử dụng trong nhiều năm tới .
Đừng lạc lối giữa muôn vàn câu lệnh và bài giảng. Hãy tham gia "Data Workshop". Tôi sẽ giới thiệu những khái niệm cốt lõi mà tôi đã dày công biên soạn qua vô số lần thử nghiệm và sai sót. Nếu bây giờ bạn bỏ qua bài giảng khác, bạn sẽ quay lại và thốt lên: "À... đáng lẽ mình nên nghe bài đó ngay từ đầu..." Biết rằng đó là một kỹ năng, chứ không phải là một kỹ năng! Học kỹ năng này sẽ giúp cuộc sống của bạn thực sự thoải mái!
Cần có máy tính để thực hành trong buổi thuyết trình.
Cấu hình máy tính của bạn sẽ ổn miễn là thời gian khởi động không quá 20 phút.
Chúng tôi khuyên bạn nên sử dụng Anaconda để cài đặt Python. Vui lòng tham khảo hướng dẫn cài đặt tại https://m.blog.naver.com/kiddwannabe/221154599192
H. Người không chuyên ngành có thể tham gia khóa học này không? Tôi mới học lập trình...
A. Khóa học này dành cho sinh viên không chuyên ngành. Chúng tôi sẽ hướng dẫn bạn từng bước, bắt đầu từ việc cài đặt chương trình. Tôi sẽ liên tục chia sẻ các mẹo và thủ thuật của mình. Tôi khuyên bạn nên xem hết tất cả các video bài giảng mà không bỏ sót một video nào.
※ Nếu bạn quen thuộc với lập trình, chúng tôi khuyên bạn nên nghe ở tốc độ nhanh hơn hoặc tham gia các bài giảng khác.
H. Ai sẽ được lợi khi lắng nghe điều này?
A. Có ai tò mò về những gì họ có thể làm với Python không!
Bạn có sợ vì đây là lần đầu tiên bạn lập trình không?
Bất kỳ ai muốn giao công việc cho máy tính!
H. Sự khác biệt so với các bài giảng khác là gì?
A. Đây không phải là bài giảng mà bạn chỉ cần nhìn vào PPT!
Đây không phải là bài giảng chỉ đọc mã bạn đã nhập!
Đây là bài giảng thực hành , trong đó bạn sẽ nhập và thực hiện từng lệnh, kiểm tra lỗi và xem xét kết quả.
H. Có tài liệu thực hành và tài liệu nào được sắp xếp hợp lý không?
A. Chúng ta sẽ tiến hành bằng cách nhập từng phần vào sổ tay Jupyter trống sao cho phù hợp với môi trường lập trình trực tiếp nhất có thể và chúng ta sẽ tiến hành bài giảng bằng cách sử dụng sơ đồ PPT cho những phần thực sự cần giải thích bằng hình ảnh.
[đã cập nhật]
- 17/02/2021. Đã thêm tính năng thu thập dữ liệu Instagram.
- 06/05/2021 Đã thêm tính năng thu thập thông tin trên YouTube.
- 31/01/2023 Đã thêm phương pháp sử dụng mã cập nhật tự động cho phiên bản trình duyệt Chrome.
Các bài giảng sẽ được bổ sung liên tục,
Nếu bạn có bất kỳ yêu cầu hoặc thắc mắc nào, vui lòng liên hệ với chúng tôi qua email datago0ba0@gmail.com. Xin cảm ơn.
Khóa học này dành cho ai?
Bất cứ ai mới học lập trình
Bất cứ ai muốn thu thập dữ liệu
Bất cứ ai muốn thu thập dữ liệu SNS
Bạn nhìn thấy sẽ hiểu, nhưng bạn quá lười để tự mình làm điều đó.
Cần biết trước khi bắt đầu?
Đánh máy không cần nhìn bàn phím tiếng Anh
130
Học viên
5
Đánh giá
4
Trả lời
4.6
Xếp hạng
1
Khóa học
Tất cả
48 bài giảng ∙ (11giờ 11phút)
Tất cả
5 đánh giá
4.6
5 đánh giá
4.601.090 ₫
Khám phá các khóa học khác trong cùng lĩnh vực!