강의

멘토링

커뮤니티

BEST
Data Science

/

Data Engineering

Hiện tại, công nghệ trích xuất dữ liệu mạnh nhất: Khám phá Scrapy và Selenium

Đối với những ai muốn học về khoa học dữ liệu, dữ liệu lớn và trích xuất dữ liệu - Chúng tôi đã biên soạn nhiều ví dụ để bạn có thể nhanh chóng làm quen với các kỹ thuật trích xuất dữ liệu mới nhất và tốt nhất hiện nay.

(4.9) 112 đánh giá

1,261 học viên

  • funcoding
Web Crawling
Scrapy
Selenium

Đánh giá từ những học viên đầu tiên

Bạn sẽ nhận được điều này sau khi học.

  • Thu thập dữ liệu bằng Selenium/Headless Chrome/PhantomJS

  • Thu thập dữ liệu bằng cách điều khiển trình duyệt theo chương trình

  • Crawl bằng Scrapy

  • Cào trang web động

20.000 người đã đăng ký lớp học trực tuyến và ngoại tuyến!
Dễ dàng học công nghệ thu thập dữ liệu (thu thập dữ liệu) mạnh mẽ nhất hiện có
Bài giảng rất đầy đủ

Khóa học này là khóa học có hệ thống để tìm hiểu các kỹ thuật thu thập dữ liệu Python và thu thập dữ liệu cùng với Khóa học giới thiệu về Python và Khóa học cơ bản về thu thập dữ liệu . Đây là bài giảng đặc biệt được tạo ra với mục đích hướng đến quan điểm của sinh viên nhiều nhất có thể , đồng thời diễn ra song song với công việc của họ và là bài giảng mà bạn có thể học từng chức năng một trong thời gian ngắn, cùng với bài giảng và xây dựng thêm khả năng xử lý dữ liệu của bạn .

# Kỹ thuật bò nào nhanh nhất và ổn định nhất?

Các kỹ thuật Python cơ bản nhất là những kỹ thuật sử dụng các yêu cầu và thư viện BeautifulSoup. Tuy nhiên, có nhiều trường hợp việc thu thập dữ liệu trở nên khó khăn khi chỉ sử dụng các công nghệ liên quan cho từng trang web. Các công nghệ được sử dụng trong trường hợp này là Selenium và Headless Chrome. Các công nghệ liên quan cho phép thu thập dữ liệu ngay cả trong những môi trường yêu cầu xử lý đặc biệt, chẳng hạn như các trang web yêu cầu đăng nhập. Ngoài ra, khi thu thập một lượng lớn dữ liệu một cách đáng tin cậy thay vì chỉ thu thập một trang web duy nhất, một khuôn khổ có tên là Scrapy sẽ được sử dụng. Scrapy là công nghệ thu thập dữ liệu nhanh nhất và đáng tin cậy nhất.

# Có khó không? Tôi cần biết bao nhiêu? Có thể thực hiện điều này trên máy tính của tôi không?

Nếu bạn có thể hiểu được những điều cơ bản về lập trình Python và thu thập dữ liệu, chúng tôi đã sắp xếp chúng để bạn có thể thu thập các ví dụ thực sự có thể thu thập dữ liệu, tập trung vào các phần cốt lõi và sử dụng chúng ngay lập tức. Ngoài ra, vì công nghệ liên quan gần với công nghệ sử dụng hơn là công nghệ cần được hiểu sâu, nếu bạn đặt ra phạm vi và tìm hiểu từng bước, tập trung vào các phần cần được hiểu, bạn có thể học được. dễ dàng hơn và trong thời gian ngắn hơn.

* Khóa học này sẽ giúp bạn học các công nghệ phức tạp liên quan một cách dễ dàng trong thời gian ngắn! Nó được cấu trúc để bạn có thể học được .

# Tôi không có kiến ​​thức cơ bản về lập trình Python và crawling. Tôi có thể học một cách có hệ thống không?

Khóa học này phù hợp với lộ trình phân tích dữ liệu/khoa học được mô tả ở cuối phần giới thiệu chi tiết này. Nếu bạn học khóa học này cùng với Python Introduction và Crawling Basics Bootcamp, bạn sẽ học một cách có hệ thống từ những điều cơ bản đến công nghệ thu thập dữ liệu hoặc phân tích dữ liệu/khoa học công nghệ tuần tự. Nó đã được cấu hình để cho phép điều này.

Đặc biệt, lập trình Python và cơ bản về thu thập dữ liệu được cung cấp riêng thông qua các lớp học trại hè Python Introduction và Crawling Basics , và thông qua hai môn học này, ngay cả những người chưa từng biết đến Python hoặc thu thập dữ liệu cũng có thể theo dõi từ dưới lên, bắt đầu bằng việc cài đặt chương trình trong mỗi Windows /Môi trường Mac. Chúng tôi đã giải thích mọi thứ, bao gồm kiến ​​thức cơ bản về web.

# Tôi muốn tìm hiểu tất cả các công nghệ khác nhau liên quan đến thu thập dữ liệu, một công nghệ thu thập dữ liệu. Tôi có thể làm điều đó như thế nào?

Bạn có thể tìm hiểu tất cả các công nghệ thu thập dữ liệu hiện có thông qua Trại huấn luyện giới thiệu về Python và Cơ bản về thu thập dữ liệu cũng như khóa học này.

# Tôi nên học các kỹ thuật thu thập dữ liệu ở mức độ nào để phục vụ cho mục đích phân tích/khoa học dữ liệu?

Bạn chỉ cần học đến trình độ được đề cập trong khóa học Giới thiệu về Python và Khóa học cơ bản về thu thập thông tin cũng như bài giảng này. Ngoài ra, cả hai bài giảng đều đề cập đến kiến ​​thức nền tảng cần thiết để tìm hiểu các công nghệ liên quan (HTML/CSS tạo nên web), nhiều định dạng dữ liệu cần thiết để xử lý dữ liệu trong lập trình và thậm chí cả cách sử dụng Open API. Nhờ đó, bạn có thể tự nhiên làm quen với cách xử lý dữ liệu trong lập trình.

* Ngoài ra, khi tiến hành phân tích dữ liệu/công trình khoa học trong tương lai, điều khó khăn nhất thực sự là thu thập được dữ liệu tôi muốn. Với khóa học này và trại huấn luyện Python Introduction và Crawling Basics, bạn sẽ được trang bị vũ khí mạnh mẽ nhất để có được dữ liệu bạn muốn và bạn sẽ trở thành một nhà khoa học/phân tích dữ liệu có năng lực và cạnh tranh hơn nhiều.

Để giúp bạn làm quen với các công nghệ ứng dụng có liên quan trong thời gian ngắn
Chúng tôi cung cấp các bài giảng dựa trên nhiều mã và tài liệu khác nhau, theo từng bước/công nghệ.

Đừng lãng phí thời gian của bạn!
Không phải là chúng ta không thể làm được điều gì đó vì chúng ta không có thông tin!
Học với các bài giảng đã được chứng minh!

Đã có người nào trả hàng triệu won tiền học phí để tham gia một lớp học chỉ dạy ngữ pháp chưa? Khi bạn nghe lớp học, bạn sẽ tự nhiên lặp lại nó, và nó sẽ ăn sâu vào đầu bạn. Nó thậm chí sẽ được mô phỏng để có thể sử dụng trong thực tế, vì vậy bạn có thể sử dụng nó như vậy! Nó có thể được điều chỉnh để phù hợp với nhiều trường hợp khác nhau và các kỹ năng cơ bản có thể được xây dựng đúng cách. Một chương trình giảng dạy dành cho sinh viên theo học ngành khoa học xã hội và thậm chí còn tính đến thời gian giảng dạy. Bài giảng này được tạo ra sau nhiều suy nghĩ vì tôi rất thích các bài giảng trực tuyến.

Thu thập dữ liệu bằng cách thao tác trình duyệt và chuột với Selenium (Ví dụ về Thu thập dữ liệu bình luận tin tức tiếp theo)

Nếu bạn tò mò về chương trình giảng dạy có hệ thống, tôi khuyên bạn nên tham gia các bài giảng về thu thập dữ liệu, phân tích dữ liệu và cơ sở dữ liệu.

'À! Thật sự khác biệt!' Đây là loạt bài giảng về CNTT mà tôi đã dày công biên soạn để bạn có thể cảm nhận được điều đó.
Chỉ những người lý trí, biết quan tâm đến nhau và có thể xây dựng được mối quan hệ tốt đẹp
Hãy tham gia lớp học nhé!

Các khóa học hiện đang mở hoặc dự kiến ​​mở trên Inflearn

Khóa học Full Stack: Tech Tree sẽ giúp bạn tự tạo các dịch vụ web/ứng dụng mới nhất từ ​​A đến Z

Chúng được đánh số theo thứ tự chín.

1. Cơ bản về Python và thu thập dữ liệu (thu thập dữ liệu) (Python và web, cơ bản về hiểu biết dữ liệu)
2. MySQL và lưu trữ dữ liệu/phân tích cơ bản (SQL Database Basics)
3. Cơ bản về dữ liệu lớn NoSQL(mongodb) (Cơ bản về cơ sở dữ liệu NoSQL)
4. Fastest Full Stack: Python Backend và Công nghệ Web Cơ bản [Full Stack Phần 1]
5. Cơ sở vững chắc về Front-end cho Full Stack: Javascript (Vanilla JS và ES6+) và các công nghệ web mới nhất [Full Stack Phần 2]
6. Docker và công nghệ máy chủ mới nhất cho full stack (Linux, nginx, AWS, HTTPS, triển khai flask) [Full Stack Phần 3]
7. Flutter Basics for Full Stack App Development (Full Stack Phần 4, dự kiến ​​mở vào nửa cuối năm 2021)
8. Vue hoặc React Framework cơ bản cho Full Stack (Full Stack Phần 5, dự kiến ​​vào nửa cuối năm 2021)

Do công nghệ ứng dụng/web đang thay đổi nhanh chóng nên chúng tôi đã điều chỉnh các ưu tiên của mình. Để đi đầu trong các công nghệ mới nhất, trước tiên chúng ta sẽ tập trung vào Flutter, công nghệ mới nhất hỗ trợ cả web và ứng dụng.

* Các gói khóa học đầy đủ cũng có sẵn với mức giá ưu đãi. (Mức chiết khấu sẽ sớm được giảm.)
[Người mới bắt đầu~Trung cấp] Lộ trình full-stack dễ nhất và mới nhất (phím tắt)

Khóa học Phân tích dữ liệu/Khoa học: Công nghệ mới nhất có thể đưa dữ liệu bạn muốn vào, phân tích dữ liệu và thậm chí đưa ra dự đoán.

Chúng được đánh số theo thứ tự chín.

1. Cơ bản về Python và thu thập dữ liệu (thu thập dữ liệu) (Python và web, cơ bản về hiểu biết dữ liệu)
2. Chinh phục Scrapy và Selenium (Công nghệ trung gian thu thập dữ liệu tiên tiến nhất hiện nay và kiến ​​thức CNTT liên quan)
3. Cơ bản về SQL và Lưu trữ/Phân tích dữ liệu (Lưu trữ/Phân tích dữ liệu)
4. NoSQL(mongodb) Cơ bản về dữ liệu lớn (Lưu trữ/Phân tích dữ liệu lớn)
5. Phân tích dữ liệu Python đầu tiên (Xử lý dữ liệu trước và Pandas, Hình ảnh hóa mới nhất) [Khoa học dữ liệu Phần 1]
6. Trại huấn luyện Python Machine Learning dành cho người mới bắt đầu (Dễ! Học các khái niệm/ứng dụng với các vấn đề thực tế) [Khoa học dữ liệu Phần 2]
7. Trại huấn luyện trí tuệ nhân tạo AI (Tự động hóa dự đoán dữ liệu, nửa đầu của 22') [Khoa học dữ liệu Phần 3]

* Chúng tôi cũng cung cấp các gói bài giảng khoa học dữ liệu hiện tại với mức giá ưu đãi. (Mức chiết khấu sẽ sớm được giảm.)
[Người mới bắt đầu~Người mới bắt đầu] Dễ dàng học các kỹ năng phân tích dữ liệu cơ bản để làm việc! Học kỹ (phím tắt)

 

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Dành cho những ai muốn học cách thu thập dữ liệu đúng cách như một kỹ năng khoa học dữ liệu cơ bản

  • Dành cho những ai muốn học các kỹ thuật thu thập dữ liệu mới nhất

Cần biết trước khi bắt đầu?

  • Python nhập môn và cơ sở về trích xuất dữ liệu bootcamp (hơn 5.000 người tham gia trực tuyến và ngoại tuyến) cần tuyển giảng viên

Xin chào
Đây là

33,118

Học viên

2,399

Đánh giá

1,949

Trả lời

4.9

Xếp hạng

13

Các khóa học

잔재미코딩, Dave Lee

  • About 잔재미코딩 소개 블로그 [클릭]

  • 주요 경력: 쿠팡 수석 개발 매니저/Principle Product Manager, 삼성전자 개발 매니저 (경력 약 15년)

  • 학력: 고려대 일어일문 / 연세대 컴퓨터공학 석사 (완전 짬뽕)

  • 주요 개발 이력: 삼성페이, 이커머스 검색 서비스, RTOS 컴파일러, Linux Kernel Patch for NAS

  • 저서: 리눅스 커널 프로그래밍, 리눅스 운영 체제의 이해와 개발, 누구나 쓱 읽고 싹 이해하는 IT 핵심 기술, 왕초보를 위한 파이썬 프로그래밍 입문서

  • 운영 사이트: 잔재미코딩 (http://www.fun-coding.org) [클릭]

  • 풀스택/데이터과학/AI 관련 무료 자료를 공유하는 사이트입니다.

  • 기타: 잔재미코딩 유투브 채널 [클릭] 

    • IT 학습에 도움이 되는 팁/ 짧은 무료 강의를 공유하고자, 조금씩 시작하고 있습니다~

최신 현업과 IT 강의를 병행하며, 8년째 꾸준히 견고한 풀스택, 데이터과학, AI 강의를 만들고 있습니다.

 

Chương trình giảng dạy

Tất cả

42 bài giảng ∙ (8giờ 57phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

112 đánh giá

4.9

112 đánh giá

  • kwansoon.kr님의 프로필 이미지
    kwansoon.kr

    Đánh giá 5

    Đánh giá trung bình 4.0

    5

    98% đã tham gia

    제 생각에는 크롤링 기초 강좌 중에서는 최고인 것 같습니다. 논문 떄문에 급하게 기술을 습득했어야 했는데 생각보다 쉽지 않았습니다. 다른 (해외)강의도 들어보고 책도 봤는데.... 이 강좌 2번 딱 들으니깐 이제 필요한 데이터는 수집이 가능합니다! 감사합니다! 화이팅 하십시요! 강사님~

    • 잔재미코딩 DaveLee
      Giảng viên

      안녕하세요 이렇게 좋은 수강평을 써주셔서 정말 감사합니다. 필요한 기술을 혼자 익히려먼 굉장히 오랜 시간이 걸리는 부분을 짧은 시간안에 필요한 부분만 빠르게 자기것으로 만들수 있도록 하는 것이 본 강좌의 목표중 하나였는데 이 목적에 딱 맞는 정말 귀한 수강평을 달아주셔서 너무 보람되고 기쁩니다. 감사합니다.

  • 김상원님의 프로필 이미지
    김상원

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    62% đã tham gia

    3년째 수강중입니다!! 제 인생 최고의 강사님~ 친절도 5점 / 설명력 5점 / 목소리 4.5점 -> 반올림 5점 / 예제선정 5점

    • ^^ 높은 점수 감사드려요 늘 함께해주시는 수강자님이시군요~! 더욱더 열심히 하겠습니다~

  • allrounder님의 프로필 이미지
    allrounder

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    초급에서 너무 재밌게 배워서 중급도 배웠는데 너무 좋았습니다! 제가 강의가 나온지 조금 후에 시작해서 바뀐부분도 많고(응용해서 스스로 해보려고 열심히 노력했으나,, 몇개는 끝까지 실패했습니다ㅠ) 아무튼 기본적인 플로우 알기에는 너무 좋았습니다. 이제 고급강의로 넘어가는데, 해당 강의에서는 중급에서 서버 변경으로 제가 실패한 부분 극복할 수 있는 기회가 되었으면 좋겠네요

    • 감사합니다~^^ 발전하고 계시네요 수강자님의 성장의 여정을 응원합니다!!

  • 무자비한 낭만주먹님의 프로필 이미지
    무자비한 낭만주먹

    Đánh giá 19

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    최고의강의

    • 좋은 수강평 감사합니다. 도움이 되셨다고 이해하겠습니다. 감사합니다.

  • JaeChul Lee님의 프로필 이미지
    JaeChul Lee

    Đánh giá 3

    Đánh giá trung bình 5.0

    5

    81% đã tham gia

    이해가 쏙쏙

Khóa học khác của funcoding

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!