Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Analysis

[DS 뭐하니- 첫 번째 이야기] Làm web crawling cứ hai ngày một lần

"Theo đuổi xu hướng cũng quan trọng, nhưng nền tảng vững chắc mới tạo nên thực lực thật sự" Khóa học này là khóa nhập môn giúp hiểu được dòng chảy của khoa học dữ liệu và học đúng cách từ những kỹ thuật thực tiễn nhất.

(5.0) 6 đánh giá

57 học viên

  • joteacher
실습 중심
크롤링
Python
Web Crawling

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Học phát triển web crawler bằng Python, từ cơ bản đến thực tế.

  • Học các kỹ thuật crawl đa dạng sử dụng requests, BeautifulSoup, Selenium

  • Thực hành dự án thu thập dữ liệu thực tế như tin tức, trung tâm mua sắm, blog, cộng đồng, v.v.

  • Phương pháp xử lý dữ liệu thu thập, lưu CSV, Excel và lập lịch tự động.

  • Trải nghiệm toàn bộ quy trình thiết kế và triển khai web crawler của riêng mình.

Khoa học dữ liệu: Bắt đầu từ đâu?

Với công nghệ thay đổi quá nhanh như vậy, bạn có bối rối không biết nên học gì trước không?
Bắt đầu bằng việc biết cách thu thập và xử lý dữ liệu.
Đó chính là lúc công nghệ thu thập dữ liệu web phát huy tác dụng.

Xin chào, tôi là anh Cho.

Xin chào mọi người. Tôi là một doanh nhân.
Tôi hiện là giảng viên kỹ thuật cung cấp đào tạo CNTT chuyên nghiệp.

Đây là câu hỏi tôi nghe thường xuyên nhất trong lĩnh vực giáo dục.
“Ngày nay có quá nhiều công nghệ. Tôi nên học cái gì đây?”

Hàng loạt công nghệ, khuôn khổ và xu hướng ra đời mỗi ngày...
Chúng ta có nên làm theo không?

Không cần thiết phải làm như vậy.
Chìa khóa là Vấn đề là, 'Bạn không cần phải biết mọi thứ, nhưng bạn cần hiểu những điều cơ bản.'

Nếu bạn hiểu được dòng chảy và nguyên tắc của công nghệ,
Công nghệ mới không phải là thứ đáng sợ,
Nó trở thành công cụ kích thích trí tò mò.

Và bước đầu tiên là,
Khóa học này sẽ giúp bạn hiểu và làm việc với dữ liệu.

Điểm mạnh chính của khóa học này 1.

Đây không phải là khóa học để học các kỹ thuật hào nhoáng trong thời gian ngắn. Đây là khóa học để nghiên cứu sâu sắc các nội dung cơ bản tổng thể tạo thành nền tảng của các kỹ thuật hào nhoáng đó.

Điểm mạnh chính của khóa học này 2.

Được giảng dạy bởi một giảng viên kỹ thuật hiện tại , người đã giảng bài cho các học viên. Trải nghiệm các kỹ năng giảng dạy có được trong hơn 10 năm.

Tìm hiểu về những điều này

① Ngữ pháp Python cốt lõi cho dữ liệu

Để thu thập dữ liệu từ web, bạn cần có một số hiểu biết về cấu trúc của web. Là một ví dụ tiêu biểu, tôi sẽ chỉ giới thiệu những điểm chính của từ điển và khung dữ liệu có thể giúp bạn hiểu cấu trúc phân cấp.

② Tự tạo nhiều trình thu thập dữ liệu web khác nhau

Chúng tôi sẽ giới thiệu cho bạn một trình thu thập thông tin mà bạn thực sự có thể sử dụng và cách áp dụng từng bước. Bạn sẽ có thể vẽ ra bức tranh tổng thể về quy trình và cách tiếp cận để tạo ra một trình thu thập thông tin.

③ Khả năng giải quyết các vấn đề có thể phát sinh trong quá trình thu thập dữ liệu

Bạn sẽ gặp phải nhiều tình huống lỗi khác nhau khi thu thập dữ liệu. Phát triển khả năng tạo ra trình thu thập dữ liệu mạnh mẽ và hoàn hảo hơn bằng cách tự mình tạo và giải quyết các tình huống lỗi thường gặp nhất.

Những điều cần lưu ý trước khi tham gia lớp học

Môi trường thực hành

  • Hệ điều hành và Phiên bản (OS): Hỗ trợ tất cả các hệ điều hành, bao gồm Windows, macOS và Linux.

  • Công cụ sử dụng: Anaconda Jupyter Notebook (bạn có thể sử dụng các IDE khác nếu cần)

  • Cấu hình máy tính: Khuyến nghị RAM 8GB trở lên

Tài liệu học tập

  • Tất cả các tệp mã được viết trong lớp đều được cung cấp dưới dạng tệp .html.

  • Mọi thứ khác ngoài mã đều có trong mỗi video.

Kiến thức và ghi chú của người chơi

  • Khóa học này phù hợp cho người mới bắt đầu.

  • Sau khi học khóa học này, sẽ có các lớp học về phân tích dữ liệu và học máy, nơi bạn có thể học từng bước.

Bạn có thắc mắc nào không?

H) Tôi có thể theo dõi được ngay cả khi tôi không biết nhiều về Python không?

Có, dù ngữ pháp có dễ đến đâu, tôi cũng luôn giải thích.
Nếu bạn vẫn không hiểu, hãy thoải mái đặt câu hỏi.
Đội ngũ gia sư tài năng của chúng tôi cùng với người hướng dẫn của bạn sẽ trả lời các câu hỏi của bạn gần như ngay lập tức.

Q) Vậy, chúng ta chỉ học những nội dung quá dễ phải không?

Không. Mục đích của bài giảng này là đúc kết 10 năm bài giảng thành một lời giải thích cô đọng và thiết yếu cho những ai bận rộn. Tôi đã cố gắng hết sức để đảm bảo không một giây phút nào bị lãng phí.

H) Tôi có thể nhận được phản hồi về những thắc mắc của mình trong suốt khóa học không?

Vâng, ngoài người hướng dẫn này, sẽ có các gia sư. Nhiều gia sư có tay nghề cao sẽ trả lời các câu hỏi của bạn theo thời gian.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới vào ngành dữ liệu lần đầu.

  • Người thực hành muốn hiểu bản chất của việc thu thập dữ liệu hơn là phân tích

  • Người muốn củng cố thể lực cơ bản trước khi theo đuổi các xu hướng hào nhoáng.

  • Những ai muốn tìm hiểu điểm khởi đầu của quy trình dữ liệu trước khi huấn luyện AI trên đám mây

Cần biết trước khi bắt đầu?

  • Biết Python cơ bản là OK! (Không biết cũng được)

  • Nếu có chút hiểu biết về cấu trúc cơ bản của HTML (thẻ, class, id), bạn sẽ dễ dàng theo dõi hơn.

  • Mọi quá trình sẽ diễn ra tập trung vào thực hành, kết hợp xem code và kết quả (Chào đón người mới bắt đầu!)

Xin chào
Đây là

57

Học viên

6

Đánh giá

2

Trả lời

5.0

Xếp hạng

1

Khóa học

안녕하세요, 저는 대학에서 컴퓨터공학을 전공하고,
현재는 우리나라 대표 교육 기관에서 IT분야 강의(10년)를 하고 있습니다.

글로벌 IT 기업의 공인 과정을 주로 하고 있으며,
Amazon AWS, Google GCP, MS Azure, Oracle, Cisco, VMware와 같은
벤더사의 기술과 제품을 고객에게 정확하게 전달하는 업무를 담당하고 있습니다.

 

 

 

Chương trình giảng dạy

Tất cả

24 bài giảng ∙ (5giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

6 đánh giá

5.0

6 đánh giá

  • joteacher님의 프로필 이미지
    joteacher

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    Chào các bạn, mình là 조선생 đây. Rất cảm ơn sự quan tâm của mọi người, và mình sẽ cố gắng tạo ra những bài giảng hay, hữu ích trong tương lai. Hãy đón chờ Data Science Episode 2 nhé.

    • zerogeun님의 프로필 이미지
      zerogeun

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      33% đã tham gia

      Bài giảng rất hay! Chỉ dạy những điểm trọng tâm ạ!

      • joteacher
        Giảng viên

        Bạn 김영근. Rất cảm ơn bạn đã để lại nhận xét. Chúng tôi sẽ luôn cố gắng hết sức hỗ trợ bạn.

    • ssmktr9286님의 프로필 이미지
      ssmktr9286

      Đánh giá 9

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • joteacher
        Giảng viên

        Cảm ơn đánh giá khóa học quý giá. Sẽ cố gắng hết sức để mang lại nhiều giá trị hơn nữa.

    • db75362066님의 프로필 이미지
      db75362066

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      Rất khuyến khích đối với người không chuyên IT. Tôi không chuyên ngành IT, Python thì chỉ nghe tên thôi, nhưng giảng viên đã hướng dẫn từng chút một rất nhiệt tình nên tôi hoàn toàn không gặp khó khăn gì khi theo kịp bài giảng. Cách giải thích của giảng viên thực sự tập trung vào việc 'tại sao lại học cái này', nhờ đó chủ đề web crawling vốn mơ hồ đã trở nên cụ thể hơn rất nhiều. Nếu tự học thì chắc đã không thể bắt đầu, nhờ có khóa học này mà tôi đã tự tin hơn về data science! Trong phần giới thiệu, tôi nghe nói sẽ ra mắt khóa học tiếp theo theo dạng series, vậy khi nào thì có thể học được khóa đó? Nó có liên kết với khóa học này không?

      • joteacher
        Giảng viên

        Xin chào db7536. Cảm ơn bạn vì bài đánh giá quý giá. Đúng như bạn nói, các khóa học tiếp theo (Phân tích dữ liệu, Học máy) theo chuỗi đã được lên kế hoạch, và sẽ được cập nhật lần lượt vào tháng tới, tháng 7 và tháng 8. Cảm ơn bạn đã quan tâm.

    • echisaki9842님의 프로필 이미지
      echisaki9842

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      74% đã tham gia

      Độ sâu vừa phải, không thừa không thiếu Dù giải thích từ cơ bản, nhưng không dừng lại ở mức quá cơ bản mà dẫn dắt đến mức có thể sử dụng thực tế, điều đó thật tuyệt. Việc thỉnh thoảng chỉ ra hướng đi theo kiểu “cái này sau này sẽ được dùng ở chỗ này” giúp tôi hình dung được phải tiến bước thế nào trong lĩnh vực phân tích dữ liệu hay học máy. Là một buổi giảng thực tế và có chiều sâu nên tôi không thấy lãng phí thời gian chút nào.

      • joteacher
        Giảng viên

        Gửi echisaki. Cảm ơn đánh giá khóa học quý báu của bạn. Chúng tôi sẽ cố gắng hết sức để giúp ích cho bạn trong tương lai.

    626.827 ₫

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!