Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Engineering

Những điều cơ bản về Airflow được chia sẻ bởi nhà lãnh đạo dữ liệu tại Thung lũng Silicon

Khi kỷ nguyên AI đến, việc xây dựng đường dẫn dữ liệu đã trở thành năng lực cốt lõi quyết định khả năng cạnh tranh của doanh nghiệp. Hãy học hỏi bí quyết xây dựng đường dẫn dữ liệu hiệu quả bằng cách sử dụng Airflow được sử dụng rộng rãi nhất, trực tiếp từ các chuyên gia Thung lũng Silicon (cựu Trưởng nhóm Dữ liệu Udemy, hiện là Giáo sư Chương trình Thạc sĩ Dữ liệu tại Đại học Bang San Jose) với kinh nghiệm thực tế và kinh nghiệm giảng dạy phong phú.

(5.0) 5 đánh giá

136 học viên

  • keeyonghan9539
실습 중심
데이터파이프라인
실리콘밸리
airflow
snowflake
SQL
Python

Dịch cái này sang tiếng Việt

  • Xây dựng quy trình dữ liệu dựa trên AIrflow + Snowflake + Docker

  • Các kỹ năng SQL và Python thiết thực có thể được sử dụng ngay trong công việc thực tế về dữ liệu

Những Kỹ sư Dữ liệu ở Thung lũng Silicon Nói gì
Xây dựng đường truyền dữ liệu hiện đại!


Kiến thức thực tế từ một kỹ sư dữ liệu 30 năm tại Thung lũng Silicon


Đánh giá: 4.9! Một khóa học được đánh giá cao bởi sinh viên khoa học dữ liệu của Đại học San Jose State


Thiết kế và tự động hóa các đường ống dữ liệu hiện đại bằng Airflow & Snowflake

Gặp gỡ AirflowSnowflake
Kiến trúc kỹ thuật dữ liệu hiện đại

Trong thời đại dữ liệu khổng lồ, cốt lõi của kỹ thuật dữ liệu là thu thập và xử lý dữ liệu một cách hiệu quả và cung cấp dữ liệu khi cần. Đường ống dữ liệu tự động là cần thiết cho việc này và Airflow và Snowflake là những công cụ mạnh mẽ cho quy trình này .


Airflow tự động hóa các luồng dữ liệu phức tạp và cho phép thu thập dữ liệu chính xác và đáng tin cậy thông qua việc lập lịch trình và quản lý tác vụ linh hoạt . Snowflake là kho dữ liệu đám mây mạnh mẽ có thể xử lý và mở rộng nhanh chóng lượng dữ liệu lớn, hỗ trợ hoạt động dữ liệu ổn định trong nhiều môi trường kinh doanh khác nhau.

Trong khóa học này, bạn sẽ học cách thiết kế và vận hành đường ống dữ liệu hiệu quả bằng cách kết hợp khả năng tự động hóa quy trình làm việc của Airflow với khả năng mở rộng và hiệu suất của Snowflake . Bạn có thể tìm hiểu các công nghệ cốt lõi của kỹ thuật dữ liệu giúp kết nối việc thu thập, xử lý, lưu trữ và sử dụng dữ liệu thành một luồng duy nhất mà không cần phải thiết lập cơ sở hạ tầng phức tạp.

Tìm hiểu về những điều này

1⃣ Thiết kế đường ống dữ liệu thực tế với Airflow + Snowflake + Docker

2⃣ Tìm hiểu mọi thứ từ thiết lập môi trường Airflow đến ETL, quản lý DAG và tự động hóa cùng một lúc

3⃣ Tìm hiểu cách tối ưu hóa luồng dữ liệu và cách vận hành thông qua các ví dụ thực tế

Tôi giới thiệu điều này cho những người này

Là một kỹ sư dữ liệu
Tôi đang nghĩ về sự nghiệp của mình
Các nhà phát triển/nhà phân tích/nhà khoa học/sinh viên muốn trở thành kỹ sư dữ liệu nhưng không biết phải làm gì

Tôi quan tâm đến việc xây dựng đường ống dữ liệu
Nếu bạn làm việc với dữ liệu và cần làm việc trên các đường ống dữ liệu hoặc tò mò về phương pháp này,

Về kỹ thuật dữ liệu
Tôi muốn biết rõ hơn
Bất kỳ ai làm việc như một kỹ sư dữ liệu hoặc kỹ sư ML nhưng muốn biết thêm

Sau giờ học

  • Tìm hiểu về sứ mệnh của tổ chức dữ liệu và vai trò của kỹ thuật dữ liệu.


  • Bạn sẽ tìm hiểu về kho dữ liệu và đường ống dữ liệu tạo nên cơ sở hạ tầng dữ liệu.

    • Trong quá trình này, bạn có thể thêm kho dữ liệu có tên Snowflake vào bộ kỹ năng của mình.

    • Tìm hiểu các phương pháp hay nhất thực sự giúp bạn xây dựng và vận hành đường ống dữ liệu.

  • Bạn có thể tạo nhiều đường ống dữ liệu khác nhau dựa trên Airflow, nền tảng tạo/vận hành đường ống dữ liệu phổ biến nhất.

    • Bạn cũng sẽ học các khái niệm nâng cao như cập nhật đầy đủ, cập nhật gia tăng, lấp đầy, giám sát, v.v.

  • Với tư cách là một nhân viên dữ liệu, bạn sẽ có được kinh nghiệm thực tế về cách sử dụng Python và SQL để tạo đường ống dữ liệu, điều này sẽ nâng cao khả năng của bạn.

Thông tin chi tiết từ các chuyên gia dữ liệu đã được chứng minh tại Thung lũng Silicon

Xin chào. Tên tôi là Ki-Yong Han, và tôi là chuyên gia dữ liệu tại Thung lũng Silicon với 30 năm kinh nghiệm. Sau khi bắt đầu sự nghiệp tại Samsung Electronics, tôi đã đến Thung lũng Silicon ở tuổi 31. Dựa trên chuyên môn của tôi trong việc xây dựng các nhóm dữ liệu tại các tổ chức như Udemy (được niêm yết trên NASDAQ vào năm 2021) và Polyvore (được Yahoo mua lại vào năm 2015), cũng như cung cấp dịch vụ tư vấn dữ liệu cho nhiều công ty có trụ sở tại Thung lũng Silicon và Hàn Quốc, cùng kinh nghiệm giảng dạy thạc sĩ tại Đại học San Jose State, nơi có tỷ lệ việc làm cao nhất tại Thung lũng Silicon, tôi sẽ chia sẻ các kỹ năng thiết yếu dành cho các nhà khoa học dữ liệu.

Những điều cần lưu ý trước khi tham gia lớp học

Môi trường thực hành

  • Chạy Airflow trên Docker. Trong bài giảng này, chúng tôi sẽ giới thiệu Docker và giải thích quá trình cài đặt.

  • Đối với kho dữ liệu của mình, chúng tôi sử dụng bản dùng thử miễn phí của Snowflake. Bạn có thể sử dụng miễn phí trong 30 ngày hoặc 400 đô la tín dụng, không cần nhập thông tin thẻ tín dụng và bạn có thể dùng thử miễn phí một lần nữa mà không gặp vấn đề gì sau khi thời gian dùng thử miễn phí kết thúc (nhưng bạn sẽ cần thiết lập môi trường mới).

  • Chúng tôi sử dụng Google Colab để giới thiệu về mã hóa đường truyền dữ liệu.

Tài liệu học tập

Kiến thức và ghi chú của người chơi

  • Ngữ pháp Python cơ bản (Người mới bắt đầu)


  • Kiến thức SQL cơ bản (Người mới bắt đầu)

  • Sẽ theo đuổi một cách siêng năng

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những người đang làm hoặc muốn làm kỹ sư dữ liệu

  • Những người đang hoặc muốn làm công việc liên quan đến pipeline dữ liệu

  • Người có hứng thú với công việc/dự án liên quan đến dữ liệu

Cần biết trước khi bắt đầu?

  • Python (Sơ cấp)

  • SQL (Sơ cấp)

Xin chào
Đây là

851

Học viên

49

Đánh giá

30

Trả lời

4.9

Xếp hạng

5

Các khóa học

컴퓨터 공학 석사 후 삼성전자에서 시작된 커리어가 친구덕에 실리콘밸리로 이어져 지난 29년간 13개의 다양한 스테이지의 회사를 다녔습니다 (창업, 대기업들, 다수의 스타트업들).

  • 야후: 엔지니어링 디렉터로 검색엔진 개발.

  • 유데미. 데이터팀을 처음 만들어 30명까지 성장. 2021년 10월에 나스닥 상장

  • 삼성전자

  • ...

중간에 11개월 쉬어보기도 했고 본의 아니게 엔젤투자자(Chartmetric, Goodtime.io, Select Star, EO, 비지니스 캔버스, ...), 어드바이저(몰로코, 블라인드, 월급쟁이부자들, ...), 컨설팅(SK텔레콤, 현대카드, 이마트 등등) 등의 역할을 하면서 나만의 브랜드를 만들었습니다. 실패를 실패가 아닌 교훈으로 보는 긍정의 힘과 꾸준함이라는 복리의 힘을 믿습니다.

https://www.linkedin.com/in/keeyonghan/

유투브 채널

월급쟁이부자들 강의

Chương trình giảng dạy

Tất cả

68 bài giảng ∙ (11giờ 58phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

5 đánh giá

5.0

5 đánh giá

  • horongt님의 프로필 이미지
    horongt

    Đánh giá 1

    Đánh giá trung bình 5.0

    5

    100% đã tham gia

    I've finally completed the course!! I was able to gain a lot technically, but the overall concepts of data engineering that the instructor took the time to explain were really helpful (content from Section 2, the future of data engineering). Through this, I was able to gain great insights into how to design pipelines and what technology stack to choose. Also, I liked that the instructor mentioned the concerns that data engineers should have from time to time during the lecture. In addition, the lecture itself was created to allow you to learn practical tips and theoretical parts in a balanced way, so I liked the part where they tell you exactly what you need to know and leave the rest to the person studying. Thank you for the great lecture!!

    • keeyonghan9539
      Giảng viên

      Thank you for the kind review. I also have an SQL course created from a data analysis/utilization perspective. I'm planning to release a course related to Spark by early April, so please check that out later.

    • Okay!! I can listen to the SQL lecture while waiting for the Spark lecture!

  • dataarchitect0님의 프로필 이미지
    dataarchitect0

    Đánh giá 6

    Đánh giá trung bình 4.2

    5

    100% đã tham gia

    • emfoa230542님의 프로필 이미지
      emfoa230542

      Đánh giá 5

      Đánh giá trung bình 5.0

      5

      60% đã tham gia

      • mscsy01049265님의 프로필 이미지
        mscsy01049265

        Đánh giá 2

        Đánh giá trung bình 4.5

        5

        33% đã tham gia

        • pst54016539님의 프로필 이미지
          pst54016539

          Đánh giá 1

          Đánh giá trung bình 5.0

          5

          31% đã tham gia

          2.775.946 ₫

          Khóa học khác của keeyonghan9539

          Hãy khám phá các khóa học khác của giảng viên!

          Khóa học tương tự

          Khám phá các khóa học khác trong cùng lĩnh vực!