강의

멘토링

로드맵

Data Science

/

Data Analysis

[DS 뭐하니- 첫 번째 이야기] Làm web crawling cứ hai ngày một lần

"Theo đuổi xu hướng cũng quan trọng, nhưng nền tảng vững chắc không dao động mới tạo nên thực lực thật sự" Khóa học này là khóa nhập môn giúp hiểu được dòng chảy của khoa học dữ liệu và học đúng cách từ những kỹ thuật thực tiễn nhất.

(5.0) 6 đánh giá

61 học viên

  • joteacher
실습 중심
크롤링
Python
Web Crawling

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Học phát triển web crawler bằng Python, từ cơ bản đến thực tế.

  • Học các kỹ thuật crawl đa dạng sử dụng requests, BeautifulSoup, Selenium

  • Thực hành dự án thu thập dữ liệu thực tế như tin tức, trung tâm mua sắm, blog, cộng đồng, v.v.

  • Phương pháp xử lý dữ liệu thu thập, lưu CSV, Excel và lập lịch tự động.

  • Trải nghiệm toàn bộ quy trình thiết kế và triển khai web crawler của riêng mình.

Khoa học dữ liệu, nên bắt đầu từ đâu?

Công nghệ thay đổi nhanh chóng, bạn có cảm thấy bối rối không biết nên học gì trước?
Tất cả bắt đầu từ việc biết cách thu thập và xử lý dữ liệu.
Đó chính là điểm khởi đầu, web crawling.

Xin chào, tôi là giáo viên Jo.

Xin chào mọi người. Tôi là một giảng viên công nghệ đang hoạt động đang thực hiện
các khóa đào tạo chuyên môn IT cho các doanh nghiệp.

Có một câu hỏi được nghe thấy thường xuyên nhất trong môi trường giáo dục.
"Ngày nay có quá nhiều công nghệ. Vậy tôi nên học cái gì đây?"

Vô số công nghệ, framework, xu hướng được đổ ra hàng ngày...
Liệu chúng ta có phải theo kịp tất cả không?

Không cần thiết phải như vậy.
Điểm cốt lõi là'Không cần phải biết tất cả mọi thứ, nhưng phải hiểu được căn bản'.

Khi hiểu được dòng chảy và nguyên lý của công nghệ
thì công nghệ mới không còn là đối tượng đáng sợ
mà trở thành công cụ kích thích sự tò mò.

Và bước đầu tiên đó,
hiểu và xử lý dữ liệu, chính là bắt đầu từ khóa học này.

Điểm mạnh cốt lõi của khóa học này 1.

Đây không phải là khóa học chỉ học tạm thời những kỹ thuật hào nhoáng. Đây là khóa học tìm hiểu sâu sắc nội dung cơ bản tổng thể làm nền tảng cho những kỹ thuật hào nhoáng đó.

Điểm mạnh cốt lõi thứ 2 của khóa học này.

Được giảng dạy bởi giảng viên công nghệ đang làm việc hiện đang thực hiện các khóa học doanh nghiệp cho các chuyên gia thực tế. Hãy cảm nhận kỹ năng giảng dạy được tích lũy trong 10 năm.

Chúng ta sẽ học những nội dung như thế này

① Cú pháp Python cốt lõi cho dữ liệu

Để thu thập dữ liệu từ web, bạn cần hiểu một phần cấu trúc của web. Ví dụ điển hình, tôi sẽ giới thiệu những điểm cốt lõi về dictionary và dataframe có thể hiểu được cấu trúc phân cấp.

② Tự tay tạo ra các web crawler đa dạng

Chúng tôi sẽ giới thiệu từng bước cách tạo ra một crawler có thể sử dụng thực tế và các phương pháp ứng dụng. Bạn có thể hình dung được bức tranh tổng thể về quy trình tiếp cận khi tạo ra một crawler.

③ Khả năng giải quyết các vấn đề có thể phát sinh trong quá trình crawling

Khi thực hiện crawling, bạn sẽ gặp phải nhiều tình huống lỗi khác nhau. Hãy tái hiện những tình huống lỗi có tần suất cao nhất và trực tiếp giải quyết chúng để phát triển khả năng tạo ra một crawler mạnh mẽ và hoàn hảo hơn.

Những lưu ý trước khi học

Môi trường thực hành

  • Hệ điều hành và phiên bản (OS): Có thể sử dụng trên tất cả các hệ điều hành như Windows, macOS, Linux, v.v.

  • Công cụ sử dụng: Anaconda Jupyter Notebook (có thể sử dụng IDE khác nếu cần thiết)

  • Cấu hình PC: Khuyến nghị RAM từ 8GB trở lên

Tài liệu học tập

  • Tất cả các tệp mã được tạo trong lớp học sẽ được cung cấp dưới dạng tệp .html.

  • Ngoài mã code, mọi thứ khác đều được cung cấp cùng với từng video.

Kiến thức tiên quyết và lưu ý

  • Khóa học này là một khóa học phù hợp cho người mới bắt đầu.

  • Sau khi hoàn thành khóa học này, sẽ có các lớp học phân tích dữ liệu và machine learning cho phép học tập theo từng bước.

Bạn có thắc mắc gì không?

Q) Tôi có thể theo kịp được không nếu không biết Python rõ lắm?

Vâng, dù là ngữ pháp dễ nhất tôi cũng nhất định sẽ giải thích rồi mới chuyển sang phần khác.
Dù vậy nếu vẫn chưa hiểu thì hãy để lại câu hỏi bất cứ lúc nào.
Các gia sư tài năng cùng với giảng viên sẽ trả lời gần như ngay lập tức.

Q) Vậy thì chỉ học những nội dung quá dễ thôi sao?

Không phải vậy. Mục đích của khóa học này là dành cho các bạn bận rộn, tôi đã cô đọng 10 năm kinh nghiệm giảng dạy để giải thích một cách súc tích những điều thực sự cần thiết. Tôi đã cố gắng hết sức để không có một giây nào bị lãng phí.

Q) Tôi có thể nhận được phản hồi về các câu hỏi trong quá trình học không?

Vâng, ngoài giảng viên chính còn có các tutor sẽ cùng tham gia. Nhiều tutor có năng lực sẽ thường xuyên trả lời cho các bạn.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Người mới vào ngành dữ liệu lần đầu.

  • Người thực hành muốn hiểu bản chất của việc thu thập dữ liệu hơn là phân tích

  • Người muốn củng cố thể lực cơ bản trước khi theo đuổi các xu hướng hào nhoáng.

  • Những ai muốn tìm hiểu điểm khởi đầu của quy trình dữ liệu trước khi huấn luyện AI trên đám mây

Cần biết trước khi bắt đầu?

  • Biết Python cơ bản là OK! (Không biết cũng được)

  • Nếu có chút hiểu biết về cấu trúc cơ bản của HTML (thẻ, class, id), bạn sẽ dễ dàng theo dõi hơn.

  • Mọi quá trình sẽ diễn ra tập trung vào thực hành, kết hợp xem code và kết quả (Chào đón người mới bắt đầu!)

Xin chào
Đây là

61

Học viên

6

Đánh giá

2

Trả lời

5.0

Xếp hạng

1

Khóa học

안녕하세요, 저는 대학에서 컴퓨터공학을 전공하고,
현재는 우리나라 대표 교육 기관에서 IT분야 강의(10년)를 하고 있습니다.

글로벌 IT 기업의 공인 과정을 주로 하고 있으며,
Amazon AWS, Google GCP, MS Azure, Oracle, Cisco, VMware와 같은
벤더사의 기술과 제품을 고객에게 정확하게 전달하는 업무를 담당하고 있습니다.

 

 

 

Chương trình giảng dạy

Tất cả

24 bài giảng ∙ (5giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

6 đánh giá

5.0

6 đánh giá

  • 조선생님의 프로필 이미지
    조선생

    Đánh giá 2

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    안녕하세요, 조선생입니다. 관심 가져주셔서 정말 감사드리고, 앞으로도 도움이 되는 좋은 강의 만들도록 노력하겠습니다. Data Science Episode 2를 기대해주세요.

    • Jang Jaehoon님의 프로필 이미지
      Jang Jaehoon

      Đánh giá 600

      Đánh giá trung bình 4.9

      5

      13% đã tham gia

      좋은 강의 감사합니다

      • 조선생
        Giảng viên

        소중한 수강평 감사합니다. 앞으로도 도움 드릴 수 있도록 최선을 다하겠습니다. 좋은 하루 보내세요 :)

    • 김영근님의 프로필 이미지
      김영근

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      33% đã tham gia

      정말 좋은 강의입니다! 필요한 것만 쏙쏙 알려주세요!

      • 조선생
        Giảng viên

        김영근님. 수강평 남겨주셔서 정말 감사드립니다. 앞으로도 도움 되실 수 있게 최선을 다하겠습니다.

    • 김태령님의 프로필 이미지
      김태령

      Đánh giá 9

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • 조선생
        Giảng viên

        소중한 수강평 감사합니다. 앞으로도 도움 되실 수 있게 최선을 다하겠습니다.

    • db7536님의 프로필 이미지
      db7536

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      IT 비전공자 입장에서 강력 추천합니다. IT 전공도 아니고 파이썬은 이름만 들어본 정도였는데, 정말 하나하나 친절하게 알려주셔서 수업 따라가는 데 전혀 무리가 없었어요. 강사님 설명이 진짜 ‘왜 이걸 배우는지’를 중심으로 설명해 주셔서 막연했던 웹 크롤링이라는 주제가 훨씬 구체적으로 다가왔습니다. 혼자였다면 시작도 못 했을 것 같은데, 이 강의 덕분에 데이터 사이언스에 자신감이 생겼어요! 소개에서는 시리즈로 다음 강의를 출시한다고 들었는데, 그건 언제쯤 들을 수 있을까요? 이 강의와 연계되는 건가요?

      • 조선생
        Giảng viên

        안녕하세요, db7536님. 소중한 수강평 감사합니다. 말씀하신 대로 시리즈로 다음 강좌(데이터 분석, 머신러닝)가 예정되어 있으며, 이번 년도 말에 순차적으로 업데이트할 예정입니다. 관심 가져주셔서 감사합니다.

    626.755 ₫

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!