강의

멘토링

커뮤니티

Data Science

/

Data Analysis

[DS 뭐하니- 첫 번째 이야기] Làm web crawling cứ hai ngày một lần

"Theo đuổi xu hướng cũng quan trọng, nhưng nền tảng vững chắc không dao động mới tạo nên thực lực thật sự" Khóa học này là khóa nhập môn giúp hiểu được dòng chảy của khoa học dữ liệu và học đúng cách từ những kỹ thuật thực tiễn nhất.

(5.0) 7 đánh giá

63 học viên

Độ khó Nhập môn

Thời gian Không giới hạn

  • joteacher
Python
Python
Web Crawling
Web Crawling
Python
Python
Web Crawling
Web Crawling

Đánh giá từ những học viên đầu tiên

Đánh giá từ những học viên đầu tiên

5.0

5.0

김영근

33% đã tham gia

Bài giảng rất hay! Chỉ dạy những điểm trọng tâm ạ!

5.0

echisaki

74% đã tham gia

Độ sâu vừa phải, không thừa không thiếu Dù giải thích từ cơ bản, nhưng không dừng lại ở mức quá cơ bản mà dẫn dắt đến mức có thể sử dụng thực tế, điều đó thật tuyệt. Việc thỉnh thoảng chỉ ra hướng đi theo kiểu “cái này sau này sẽ được dùng ở chỗ này” giúp tôi hình dung được phải tiến bước thế nào trong lĩnh vực phân tích dữ liệu hay học máy. Là một buổi giảng thực tế và có chiều sâu nên tôi không thấy lãng phí thời gian chút nào.

5.0

db7536

100% đã tham gia

Rất khuyến khích đối với người không chuyên IT. Tôi không chuyên ngành IT, Python thì chỉ nghe tên thôi, nhưng giảng viên đã hướng dẫn từng chút một rất nhiệt tình nên tôi hoàn toàn không gặp khó khăn gì khi theo kịp bài giảng. Cách giải thích của giảng viên thực sự tập trung vào việc 'tại sao lại học cái này', nhờ đó chủ đề web crawling vốn mơ hồ đã trở nên cụ thể hơn rất nhiều. Nếu tự học thì chắc đã không thể bắt đầu, nhờ có khóa học này mà tôi đã tự tin hơn về data science! Trong phần giới thiệu, tôi nghe nói sẽ ra mắt khóa học tiếp theo theo dạng series, vậy khi nào thì có thể học được khóa đó? Nó có liên kết với khóa học này không?

Bạn sẽ nhận được điều này sau khi học.

  • Học phát triển web crawler bằng Python, từ cơ bản đến thực tế.

  • Học các kỹ thuật crawl đa dạng sử dụng requests, BeautifulSoup, Selenium

  • Thực hành dự án thu thập dữ liệu thực tế như tin tức, trung tâm mua sắm, blog, cộng đồng, v.v.

  • Phương pháp xử lý dữ liệu thu thập, lưu CSV, Excel và lập lịch tự động.

  • Trải nghiệm toàn bộ quy trình thiết kế và triển khai web crawler của riêng mình.

Khoa học dữ liệu, nên bắt đầu từ đâu?

Công nghệ thay đổi nhanh chóng, bạn có cảm thấy bối rối không biết nên học gì trước?
Tất cả bắt đầu từ việc biết cách thu thập và xử lý dữ liệu.
Đó chính là điểm khởi đầu, web crawling.

Xin chào, tôi là giáo viên Jo.

Xin chào mọi người. Tôi là một giảng viên công nghệ đang hoạt động đang thực hiện
các khóa đào tạo chuyên môn IT cho các doanh nghiệp.

Có một câu hỏi được nghe thấy thường xuyên nhất trong môi trường giáo dục.
"Ngày nay có quá nhiều công nghệ. Vậy tôi nên học cái gì đây?"

Vô số công nghệ, framework, xu hướng được đổ ra hàng ngày...
Liệu chúng ta có phải theo kịp tất cả không?

Không cần thiết phải như vậy.
Điểm cốt lõi là'Không cần phải biết tất cả mọi thứ, nhưng phải hiểu được căn bản'.

Khi hiểu được dòng chảy và nguyên lý của công nghệ
thì công nghệ mới không còn là đối tượng đáng sợ
mà trở thành công cụ kích thích sự tò mò.

Và bước đầu tiên đó,
hiểu và xử lý dữ liệu, chính là bắt đầu từ khóa học này.

Điểm mạnh cốt lõi của khóa học này 1.

Đây không phải là khóa học chỉ học tạm thời những kỹ thuật hào nhoáng. Đây là khóa học tìm hiểu sâu sắc nội dung cơ bản tổng thể làm nền tảng cho những kỹ thuật hào nhoáng đó.

Điểm mạnh cốt lõi thứ 2 của khóa học này.

Được giảng dạy bởi giảng viên công nghệ đang làm việc hiện đang thực hiện các khóa học doanh nghiệp cho các chuyên gia thực tế. Hãy cảm nhận kỹ năng giảng dạy được tích lũy trong 10 năm.

Chúng ta sẽ học những nội dung như thế này

① Cú pháp Python cốt lõi cho dữ liệu

Để thu thập dữ liệu từ web, bạn cần hiểu một phần cấu trúc của web. Ví dụ điển hình, tôi sẽ giới thiệu những điểm cốt lõi về dictionary và dataframe có thể hiểu được cấu trúc phân cấp.

② Tự tay tạo ra các web crawler đa dạng

Chúng tôi sẽ giới thiệu từng bước cách tạo ra một crawler có thể sử dụng thực tế và các phương pháp ứng dụng. Bạn có thể hình dung được bức tranh tổng thể về quy trình tiếp cận khi tạo ra một crawler.

③ Khả năng giải quyết các vấn đề có thể phát sinh trong quá trình crawling

Khi thực hiện crawling, bạn sẽ gặp phải nhiều tình huống lỗi khác nhau. Hãy tái hiện những tình huống lỗi có tần suất cao nhất và trực tiếp giải quyết chúng để phát triển khả năng tạo ra một crawler mạnh mẽ và hoàn hảo hơn.

Những lưu ý trước khi học

Môi trường thực hành

  • Hệ điều hành và phiên bản (OS): Có thể sử dụng trên tất cả các hệ điều hành như Windows, macOS, Linux, v.v.

  • Công cụ sử dụng: Anaconda Jupyter Notebook (có thể sử dụng IDE khác nếu cần thiết)

  • Cấu hình PC: Khuyến nghị RAM từ 8GB trở lên

Tài liệu học tập

  • Tất cả các tệp mã được tạo trong lớp học sẽ được cung cấp dưới dạng tệp .html.

  • Ngoài mã code, mọi thứ khác đều được cung cấp cùng với từng video.

Kiến thức tiên quyết và lưu ý

  • Khóa học này là một khóa học phù hợp cho người mới bắt đầu.

  • Sau khi hoàn thành khóa học này, sẽ có các lớp học phân tích dữ liệu và machine learning cho phép học tập theo từng bước.

Bạn có thắc mắc gì không?

Q) Tôi có thể theo kịp được không nếu không biết Python rõ lắm?

Vâng, dù là ngữ pháp dễ nhất tôi cũng nhất định sẽ giải thích rồi mới chuyển sang phần khác.
Dù vậy nếu vẫn chưa hiểu thì hãy để lại câu hỏi bất cứ lúc nào.
Các gia sư tài năng cùng với giảng viên sẽ trả lời gần như ngay lập tức.

Q) Vậy thì chỉ học những nội dung quá dễ thôi sao?

Không phải vậy. Mục đích của khóa học này là dành cho các bạn bận rộn, tôi đã cô đọng 10 năm kinh nghiệm giảng dạy để giải thích một cách súc tích những điều thực sự cần thiết. Tôi đã cố gắng hết sức để không có một giây nào bị lãng phí.

Q) Tôi có thể nhận được phản hồi về các câu hỏi trong quá trình học không?

Vâng, ngoài giảng viên chính còn có các tutor sẽ cùng tham gia. Nhiều tutor có năng lực sẽ thường xuyên trả lời cho các bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới vào ngành dữ liệu lần đầu.

  • Người thực hành muốn hiểu bản chất của việc thu thập dữ liệu hơn là phân tích

  • Người muốn củng cố thể lực cơ bản trước khi theo đuổi các xu hướng hào nhoáng.

  • Những ai muốn tìm hiểu điểm khởi đầu của quy trình dữ liệu trước khi huấn luyện AI trên đám mây

Cần biết trước khi bắt đầu?

  • Biết Python cơ bản là OK! (Không biết cũng được)

  • Nếu có chút hiểu biết về cấu trúc cơ bản của HTML (thẻ, class, id), bạn sẽ dễ dàng theo dõi hơn.

  • Mọi quá trình sẽ diễn ra tập trung vào thực hành, kết hợp xem code và kết quả (Chào đón người mới bắt đầu!)

Xin chào
Đây là

63

Học viên

7

Đánh giá

2

Trả lời

5.0

Xếp hạng

1

Khóa học

Xin chào, tôi tốt nghiệp chuyên ngành Khoa học máy tính tại trường đại học,
và hiện đang giảng dạy trong lĩnh vực IT (10 năm) tại một tổ chức giáo dục tiêu biểu của đất nước chúng ta.

Tôi chủ yếu thực hiện các khóa học được chứng nhận của các tập đoàn IT toàn cầu,
và đảm nhận công việc truyền đạt chính xác các công nghệ cũng như sản phẩm của các nhà cung cấp như
Amazon AWS, Google GCP, MS Azure, Oracle, Cisco, VMware đến khách hàng.to customers.

Tôi chủ yếu thực hiện công việc này và chịu trách nhiệm truyền đạt chính xác các công nghệ cũng như sản phẩm từ các nhà cung cấp như Amazon AWS, Google GCP, MS Azure, Oracle, Cisco và VMware đến khách hàng.

Tôi chủ yếu thực hiện công việc này và chịu trách nhiệm truyền đạt chính xác các công nghệ cũng như sản phẩm từ các nhà cung cấp như Amazon AWS, Google GCP, MS Azure, Oracle, Cisco và VMware đến khách hàng.

Tôi chủ yếu thực hiện công việc này và chịu trách nhiệm truyền đạt chính xác các công nghệ cũng như sản phẩm từ các nhà cung cấp như Amazon AWS, Google GCP, MS Azure, Oracle, Cisco và VMware đến khách hàng.

Chương trình giảng dạy

Tất cả

24 bài giảng ∙ (5giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

7 đánh giá

5.0

7 đánh giá

  • joteacher님의 프로필 이미지
    joteacher

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Chào các bạn, mình là 조선생 đây. Rất cảm ơn sự quan tâm của mọi người, và mình sẽ cố gắng tạo ra những bài giảng hay, hữu ích trong tương lai. Hãy đón chờ Data Science Episode 2 nhé.

    • calculator님의 프로필 이미지
      calculator

      Đánh giá 113

      Đánh giá trung bình 4.9

      Đã chỉnh sửa

      5

      100% đã tham gia

      Đây là một bài giảng giúp tôi hiểu về quy trình thu thập dữ liệu, đặc biệt là web crawling là gì và có thể làm được những gì. Dựa trên những nội dung đã học trong bài giảng này, giờ tôi có thể tự tìm hiểu và học các quy trình thu thập dữ liệu nâng cao hơn!

      • joteacher
        Giảng viên

        든든한꼬마님, cảm ơn bạn vì đánh giá khóa học quý báu. Tôi sẽ cố gắng hết sức để có thể giúp ích trong series thứ hai, thứ ba của "DS뭐하니" trong thời gian tới.

    • jjhgwx님의 프로필 이미지
      jjhgwx

      Đánh giá 647

      Đánh giá trung bình 4.9

      5

      13% đã tham gia

      Cảm ơn bạn vì khóa học tuyệt vời

      • joteacher
        Giảng viên

        Cảm ơn bạn vì đánh giá khóa học quý báu. Tôi sẽ cố gắng hết sức để có thể tiếp tục giúp đỡ bạn. Chúc bạn có một ngày tốt lành :)

    • zerogeun님의 프로필 이미지
      zerogeun

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      33% đã tham gia

      Bài giảng rất hay! Chỉ dạy những điểm trọng tâm ạ!

      • joteacher
        Giảng viên

        Bạn 김영근. Rất cảm ơn bạn đã để lại nhận xét. Chúng tôi sẽ luôn cố gắng hết sức hỗ trợ bạn.

    • ssmktr9286님의 프로필 이미지
      ssmktr9286

      Đánh giá 11

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • joteacher
        Giảng viên

        Cảm ơn đánh giá khóa học quý giá. Sẽ cố gắng hết sức để mang lại nhiều giá trị hơn nữa.

    617.190 ₫

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!