강의

멘토링

커뮤니티

Data Science

/

Data Analysis

[DS 뭐하니- 첫 번째 이야기] Làm web crawling cứ hai ngày một lần

"Theo đuổi xu hướng cũng quan trọng, nhưng nền tảng vững chắc không dao động mới tạo nên thực lực thật sự" Khóa học này là khóa nhập môn giúp hiểu được dòng chảy của khoa học dữ liệu và học đúng cách từ những kỹ thuật thực tiễn nhất.

(5.0) 7 đánh giá

62 học viên

  • joteacher
실습 중심
크롤링
Python
Web Crawling

Đánh giá từ những học viên đầu tiên

Bạn sẽ nhận được điều này sau khi học.

  • Học phát triển web crawler bằng Python, từ cơ bản đến thực tế.

  • Học các kỹ thuật crawl đa dạng sử dụng requests, BeautifulSoup, Selenium

  • Thực hành dự án thu thập dữ liệu thực tế như tin tức, trung tâm mua sắm, blog, cộng đồng, v.v.

  • Phương pháp xử lý dữ liệu thu thập, lưu CSV, Excel và lập lịch tự động.

  • Trải nghiệm toàn bộ quy trình thiết kế và triển khai web crawler của riêng mình.

Khoa học dữ liệu, nên bắt đầu từ đâu?

Công nghệ thay đổi nhanh chóng, bạn có cảm thấy bối rối không biết nên học gì trước?
Tất cả bắt đầu từ việc biết cách thu thập và xử lý dữ liệu.
Đó chính là điểm khởi đầu, web crawling.

Xin chào, tôi là giáo viên Jo.

Xin chào mọi người. Tôi là một giảng viên công nghệ đang hoạt động đang thực hiện
các khóa đào tạo chuyên môn IT cho các doanh nghiệp.

Có một câu hỏi được nghe thấy thường xuyên nhất trong môi trường giáo dục.
"Ngày nay có quá nhiều công nghệ. Vậy tôi nên học cái gì đây?"

Vô số công nghệ, framework, xu hướng được đổ ra hàng ngày...
Liệu chúng ta có phải theo kịp tất cả không?

Không cần thiết phải như vậy.
Điểm cốt lõi là'Không cần phải biết tất cả mọi thứ, nhưng phải hiểu được căn bản'.

Khi hiểu được dòng chảy và nguyên lý của công nghệ
thì công nghệ mới không còn là đối tượng đáng sợ
mà trở thành công cụ kích thích sự tò mò.

Và bước đầu tiên đó,
hiểu và xử lý dữ liệu, chính là bắt đầu từ khóa học này.

Điểm mạnh cốt lõi của khóa học này 1.

Đây không phải là khóa học chỉ học tạm thời những kỹ thuật hào nhoáng. Đây là khóa học tìm hiểu sâu sắc nội dung cơ bản tổng thể làm nền tảng cho những kỹ thuật hào nhoáng đó.

Điểm mạnh cốt lõi thứ 2 của khóa học này.

Được giảng dạy bởi giảng viên công nghệ đang làm việc hiện đang thực hiện các khóa học doanh nghiệp cho các chuyên gia thực tế. Hãy cảm nhận kỹ năng giảng dạy được tích lũy trong 10 năm.

Chúng ta sẽ học những nội dung như thế này

① Cú pháp Python cốt lõi cho dữ liệu

Để thu thập dữ liệu từ web, bạn cần hiểu một phần cấu trúc của web. Ví dụ điển hình, tôi sẽ giới thiệu những điểm cốt lõi về dictionary và dataframe có thể hiểu được cấu trúc phân cấp.

② Tự tay tạo ra các web crawler đa dạng

Chúng tôi sẽ giới thiệu từng bước cách tạo ra một crawler có thể sử dụng thực tế và các phương pháp ứng dụng. Bạn có thể hình dung được bức tranh tổng thể về quy trình tiếp cận khi tạo ra một crawler.

③ Khả năng giải quyết các vấn đề có thể phát sinh trong quá trình crawling

Khi thực hiện crawling, bạn sẽ gặp phải nhiều tình huống lỗi khác nhau. Hãy tái hiện những tình huống lỗi có tần suất cao nhất và trực tiếp giải quyết chúng để phát triển khả năng tạo ra một crawler mạnh mẽ và hoàn hảo hơn.

Những lưu ý trước khi học

Môi trường thực hành

  • Hệ điều hành và phiên bản (OS): Có thể sử dụng trên tất cả các hệ điều hành như Windows, macOS, Linux, v.v.

  • Công cụ sử dụng: Anaconda Jupyter Notebook (có thể sử dụng IDE khác nếu cần thiết)

  • Cấu hình PC: Khuyến nghị RAM từ 8GB trở lên

Tài liệu học tập

  • Tất cả các tệp mã được tạo trong lớp học sẽ được cung cấp dưới dạng tệp .html.

  • Ngoài mã code, mọi thứ khác đều được cung cấp cùng với từng video.

Kiến thức tiên quyết và lưu ý

  • Khóa học này là một khóa học phù hợp cho người mới bắt đầu.

  • Sau khi hoàn thành khóa học này, sẽ có các lớp học phân tích dữ liệu và machine learning cho phép học tập theo từng bước.

Bạn có thắc mắc gì không?

Q) Tôi có thể theo kịp được không nếu không biết Python rõ lắm?

Vâng, dù là ngữ pháp dễ nhất tôi cũng nhất định sẽ giải thích rồi mới chuyển sang phần khác.
Dù vậy nếu vẫn chưa hiểu thì hãy để lại câu hỏi bất cứ lúc nào.
Các gia sư tài năng cùng với giảng viên sẽ trả lời gần như ngay lập tức.

Q) Vậy thì chỉ học những nội dung quá dễ thôi sao?

Không phải vậy. Mục đích của khóa học này là dành cho các bạn bận rộn, tôi đã cô đọng 10 năm kinh nghiệm giảng dạy để giải thích một cách súc tích những điều thực sự cần thiết. Tôi đã cố gắng hết sức để không có một giây nào bị lãng phí.

Q) Tôi có thể nhận được phản hồi về các câu hỏi trong quá trình học không?

Vâng, ngoài giảng viên chính còn có các tutor sẽ cùng tham gia. Nhiều tutor có năng lực sẽ thường xuyên trả lời cho các bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới vào ngành dữ liệu lần đầu.

  • Người thực hành muốn hiểu bản chất của việc thu thập dữ liệu hơn là phân tích

  • Người muốn củng cố thể lực cơ bản trước khi theo đuổi các xu hướng hào nhoáng.

  • Những ai muốn tìm hiểu điểm khởi đầu của quy trình dữ liệu trước khi huấn luyện AI trên đám mây

Cần biết trước khi bắt đầu?

  • Biết Python cơ bản là OK! (Không biết cũng được)

  • Nếu có chút hiểu biết về cấu trúc cơ bản của HTML (thẻ, class, id), bạn sẽ dễ dàng theo dõi hơn.

  • Mọi quá trình sẽ diễn ra tập trung vào thực hành, kết hợp xem code và kết quả (Chào đón người mới bắt đầu!)

Xin chào
Đây là

62

Học viên

7

Đánh giá

2

Trả lời

5.0

Xếp hạng

1

Khóa học

안녕하세요, 저는 대학에서 컴퓨터공학을 전공하고,
현재는 우리나라 대표 교육 기관에서 IT분야 강의(10년)를 하고 있습니다.

글로벌 IT 기업의 공인 과정을 주로 하고 있으며,
Amazon AWS, Google GCP, MS Azure, Oracle, Cisco, VMware와 같은
벤더사의 기술과 제품을 고객에게 정확하게 전달하는 업무를 담당하고 있습니다.

 

 

 

Chương trình giảng dạy

Tất cả

24 bài giảng ∙ (5giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

7 đánh giá

5.0

7 đánh giá

  • joteacher님의 프로필 이미지
    joteacher

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Chào các bạn, mình là 조선생 đây. Rất cảm ơn sự quan tâm của mọi người, và mình sẽ cố gắng tạo ra những bài giảng hay, hữu ích trong tương lai. Hãy đón chờ Data Science Episode 2 nhé.

    • calculator님의 프로필 이미지
      calculator

      Đánh giá 58

      Đánh giá trung bình 4.9

      Đã chỉnh sửa

      5

      100% đã tham gia

      Đây là một bài giảng giúp tôi hiểu về quy trình thu thập dữ liệu, đặc biệt là web crawling là gì và có thể làm được những gì. Dựa trên những nội dung đã học trong bài giảng này, giờ tôi có thể tự tìm hiểu và học các quy trình thu thập dữ liệu nâng cao hơn!

      • joteacher
        Giảng viên

        든든한꼬마님, cảm ơn bạn vì đánh giá khóa học quý báu. Tôi sẽ cố gắng hết sức để có thể giúp ích trong series thứ hai, thứ ba của "DS뭐하니" trong thời gian tới.

    • jjhgwx님의 프로필 이미지
      jjhgwx

      Đánh giá 609

      Đánh giá trung bình 4.9

      5

      13% đã tham gia

      Cảm ơn bạn vì khóa học tuyệt vời

      • joteacher
        Giảng viên

        Cảm ơn bạn vì đánh giá khóa học quý báu. Tôi sẽ cố gắng hết sức để có thể tiếp tục giúp đỡ bạn. Chúc bạn có một ngày tốt lành :)

    • zerogeun님의 프로필 이미지
      zerogeun

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      33% đã tham gia

      Bài giảng rất hay! Chỉ dạy những điểm trọng tâm ạ!

      • joteacher
        Giảng viên

        Bạn 김영근. Rất cảm ơn bạn đã để lại nhận xét. Chúng tôi sẽ luôn cố gắng hết sức hỗ trợ bạn.

    • ssmktr9286님의 프로필 이미지
      ssmktr9286

      Đánh giá 9

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • joteacher
        Giảng viên

        Cảm ơn đánh giá khóa học quý giá. Sẽ cố gắng hết sức để mang lại nhiều giá trị hơn nữa.

    627.183 ₫

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!