Đánh giá chân thực của jason, khóa học Cùng kỹ sư Silicon Valley tìm hiểu về DBT
33 đánh giá
Điểm trung bình 5
Tôi đang xem tiếp sau khi học xong khóa Airflow. Tôi nghĩ đây có lẽ là nơi duy nhất có bài giảng về mô hình hóa hệ thống thông tin (Information System Modeling). Sau này, tôi chắc chắn sẽ mua cả khóa học "Tiêu chuẩn Kiến trúc Dữ liệu" - thứ mà nếu không biết thì không thể thăng tiến được. Dưới góc độ là một kỹ sư junior luôn gắn bó với Inflearn, nếu có một vài ví dụ thực hành ELT dưới dạng dự án cá nhân (toy project) được xây dựng bài bản — từ việc đưa API và các dữ liệu thô vào ODS, sau đó kết hợp các bảng Fact, bảng chuẩn (Dimension) để làm từ DW sang DM — thì dù giá có lên đến vài trăm nghìn won tôi cũng sẵn sàng chi trả... nhưng tiếc là không thấy có..ㅠ Không biết trong tương lai anh có kế hoạch ra mắt nội dung liên quan đến phần này không ạ..ㅠ
2
Chào anh Hong Tae-kyung, Cảm ơn anh vì những lời chia sẻ chân thành. 😊 Tôi cũng đã có nhiều trăn trở tương tự trong quá trình xây dựng bài giảng. Đúng như anh nói, phần đáng tiếc nhất khi học dbt hay mô hình hóa dữ liệu là thiếu đi môi trường thực hành để thiết kế và xây dựng luồng ODS → DW → DM với quy mô dữ liệu gần với thực tế, thay vì chỉ dừng lại ở việc học cú pháp hay tính năng đơn thuần. Đặc biệt đối với một kỹ sư dữ liệu (Data Engineer), trải nghiệm thu thập dữ liệu từ API, log, DB vận hành, sau đó sử dụng dbt để thực hiện mô hình hóa Fact/Dimension và cuối cùng là tạo ra các Data Mart sẽ gần gũi với năng lực thực chiến hơn rất nhiều. Tuy nhiên, những nội dung đào tạo theo hình thức này lại khó tìm hơn tôi tưởng. Hiện tại tôi chưa có khóa học cụ thể nào đang được chuẩn bị, nhưng tôi hoàn toàn đồng ý rằng một dự án xây dựng kho dữ liệu (Data Warehouse) lấy thực hành làm trung tâm như anh gợi ý là vô cùng giá trị. Nếu có kế hoạch thiết kế bài giảng trong tương lai, tôi sẽ cân nhắc hình thức giúp người học trải nghiệm được toàn bộ luồng xây dựng nền tảng dữ liệu thực tế, thay vì chỉ giải thích các tính năng dbt đơn thuần. Cảm ơn anh đã để lại ý kiến đóng góp quý báu. Những phản hồi như thế này thực sự là nguồn động lực và giúp ích rất nhiều cho tôi trong việc chuẩn bị các bài giảng tiếp theo. 🙏
1
Trời ơi, cảm ơn anh đã phản hồi câu hỏi trình độ thấp này của một junior như em. Ngay cả khi không nhất thiết phải có dbt, thì những bài thực hành đơn giản như kéo dữ liệu DB to DB bằng procedure cũng sẽ giúp ích cho em rất nhiều. Thay vì các công nghệ như Spark hay Airflow, em muốn học hỏi triết lý ETL/ELT của một Senior Data Engineer. Ví dụ như: dựa trên tiêu chuẩn nào của mô hình hóa hệ thống thông tin để chia bảng Fact và Dimension, hay cần cân nhắc tính Idempotent (tính lũy đẳng) trước khi đổ dữ liệu vào, và những tình huống tương tự như vậy.
0

