[데브원영] 아파치 카프카 for beginners
데브원영 DVWY
아파치 카프카란 무엇일까? 아파치 카프카는 어떻게 동작할까? 아파치 카프카의 개념은 무엇이 있을까? 궁금하시다면 이 강의를 선택하세요😎
초급
Kafka, 데이터 엔지니어링
Chúng tôi đã thu thập kiến thức lập trình ứng dụng Apache Kafka được sử dụng trong môi trường thế giới thực! Chúng ta sẽ dành thời gian để xem xét và thực hành các chức năng khác nhau của Apache Kafka, đây là chìa khóa để xây dựng đường dẫn dữ liệu.
Các khái niệm cơ bản và phương pháp sử dụng Apache Kafka
Kiến trúc dữ liệu luồng dựa trên Kafka
Khả năng phát triển và vận hành các ứng dụng của nhà sản xuất và người tiêu dùng
Khái niệm và cách sử dụng Streams và Connect
Học đúng cách cùng DevOneYoung!
Từ A đến Z về Apache Kafka 🚀
Kỹ sư dữ liệu hướng sự kiện
Đường ống dữ liệu xử lý luồng
Các khái niệm cơ bản + các chức năng khác nhau cho ứng dụng môi trường thương mại
Bản chất của Kafka được thể hiện trọn vẹn trong một bài giảng 😊
Xin chào, tôi là DevOneYoung! Apache Kafka, một nền tảng phát trực tuyến sự kiện được thiết kế để xử lý dữ liệu luồng quy mô lớn, khối lượng lớn, được nhiều nhà phát triển trong và ngoài nước yêu thích. Để tận dụng các tính năng mã nguồn mở mạnh mẽ của Apache Kafka, bạn cần có hiểu biết vững chắc về hệ sinh thái xung quanh, bao gồm các khái niệm cơ bản về Kafka.
Khóa học này cung cấp kiến thức cần thiết để phát triển hiệu quả các ứng dụng Apache Kafka . Khóa học không chỉ bao gồm các khái niệm cơ bản về Apache Kafka mà còn bao gồm các tính năng chính thức được cung cấp bởi Apache Kafka mã nguồn mở, bao gồm producer, consumer, stream và connect.
Khóa học này được thiết kế để truyền đạt đầy đủ kiến thức và chuyên môn tôi đã tích lũy được qua nhiều năm phát triển và vận hành các ứng dụng Apache Kafka. Không chỉ đơn thuần giải thích về công nghệ, khóa học này còn giải thích cách áp dụng từng tính năng và tùy chọn trong môi trường thương mại . Chúng tôi hy vọng khóa học này sẽ là bước đệm để bạn trở thành chuyên gia phát triển ứng dụng Apache Kafka.
Khi mới bắt đầu học Apache Kafka, câu hỏi khó nhất là "Tôi nên học bao nhiêu?" . Đây là một nền tảng có lịch sử lâu đời và bao gồm rất nhiều công nghệ. Kafka consumer, mà bạn thường sử dụng, có hơn 90 tùy chọn. Bạn có thực sự cần biết tất cả chúng để phát triển không?
Để trả lời câu hỏi này, tôi đã tạo ra khóa học này. Khóa học này không liệt kê tất cả các tính năng và công nghệ của Kafka. Thay vào đó, nó tập trung vào các tùy chọn và tính năng bạn sẽ cần ngay khi phát triển các ứng dụng Kafka trên môi trường production. Tôi cũng sẽ chia sẻ các giá trị cấu hình tôi đã thiết lập trong quá trình phát triển và vận hành ứng dụng.
Bằng cách tham gia khóa học này, bạn sẽ có thể phát triển và vận hành các ứng dụng Apache Kafka hiệu quả hơn và ít phải thử nghiệm sai sót hơn.
Apache Kafka
(Apache Kafka)
Tôi muốn biết những khái niệm cơ bản
nhà phát triển mới
Trở thành kỹ sư dữ liệu
đường ống dữ liệu
Tôi muốn xây dựng
nhà phát triển phần mềm phụ trợ
Xử lý dữ liệu luồng
Kiến trúc dựa trên Kafka
Tôi muốn học
kỹ sư dữ liệu
Khóa học này bao gồm các kiến thức đa dạng cần thiết để phát triển các ứng dụng tích hợp với Kafka . Bằng cách tìm hiểu chính xác từ vựng, biểu thức và công cụ được sử dụng trong Apache Kafka mã nguồn mở, khóa học này sẽ trang bị cho các nhà phát triển mới cần làm việc với Kafka ngay lập tức.
Tài liệu này cũng cung cấp giải thích chi tiết về các tùy chọn và tính năng thường dùng khi phát triển ứng dụng, rất hữu ích cho các nhà phát triển back-end cần tích hợp Kafka. Cuối cùng, tài liệu cung cấp thông tin chi tiết cho các kỹ sư dữ liệu đã áp dụng và vận hành Kafka, thông qua giải thích về hệ sinh thái xung quanh (Kết nối, Luồng) và kiến trúc.
Apache Kafka bao gồm một loạt các thuật ngữ. Các thuật ngữ như cân bằng lại (rebalancing), khóa tin nhắn (message keys), bộ phân vùng (partitioners), bộ tích lũy (accumulators) và tác vụ (tasks) có thể khá xa lạ với các nhà phát triển chưa quen với Kafka. Nếu không hiểu rõ các khái niệm đằng sau mỗi thuật ngữ, việc hiểu và phát triển Kafka có thể khá khó khăn. Bài giảng này sẽ giải thích chi tiết các khái niệm đằng sau các thuật ngữ chính được sử dụng trong Kafka.
Apache Kafka, một nền tảng phát trực tuyến sự kiện phân tán, không chỉ hỗ trợ chức năng xếp hàng tin nhắn chung mà còn cho phép xử lý luồng sự kiện theo thời gian thực. Là một nền tảng dữ liệu, nó lý tưởng cho việc tạo và vận hành các đường ống dữ liệu nhiều lần. Tuy nhiên, để tận dụng và khai thác các khả năng này, việc hiểu rõ về hệ sinh thái xung quanh là điều cần thiết. Bài giảng này đề cập đến các nhà sản xuất, người tiêu dùng, Kafka Streams và Kafka Connect, cung cấp cho các nhà phát triển ứng dụng cái nhìn sâu sắc về xử lý dữ liệu luồng.
Khi phát triển ứng dụng Kafka, bạn không cần phải học và nắm vững mọi tính năng ngay từ đầu. Mặc dù trình quản lý người dùng (consumer) đã cung cấp hơn 90 tùy chọn, nhưng bạn không nhất thiết phải sử dụng hết tất cả. Bài giảng này sẽ đề cập đến các tùy chọn bạn nên cấu hình và áp dụng ngay khi phát triển ứng dụng, cũng như các giá trị tùy chọn tôi đã sử dụng trong quá trình phát triển. Những hướng dẫn này sẽ giúp bạn giảm thiểu việc thử nghiệm và sai sót, đồng thời triển khai ứng dụng Kafka lên môi trường sản xuất nhanh hơn.
Chỉ riêng các tính năng và tùy chọn của Kafka đã bị hạn chế trong việc xử lý dữ liệu phát trực tuyến. Khả năng sử dụng của Kafka thay đổi đáng kể tùy thuộc vào công nghệ và phương pháp được sử dụng. Bài giảng này không chỉ cung cấp giải thích kỹ thuật mà còn hướng dẫn cách áp dụng các kiến trúc dựa trên Kafka vào thực tế thông qua các loại hình, lịch sử và các nghiên cứu điển hình của các kiến trúc dựa trên Kafka.
Tôi có kinh nghiệm vận hành hơn 100 đường ống dữ liệu dựa trên Kafka và phát triển nhiều ứng dụng xử lý luồng khác nhau. Tôi đã trăn trở về cách xử lý dữ liệu luồng quy mô lớn một cách hiệu quả và nỗ lực phát triển các ứng dụng an toàn hơn, nhanh hơn và hiệu quả hơn. Tôi đã kết hợp những kiến thức học được từ phát triển và vận hành đồng thời vào các bài giảng của mình. Chuyên môn thực tiễn này là kiến thức vô giá mà không dễ dàng có được thông qua tài liệu kỹ thuật.
Khi học Kafka, bạn có thể sẽ gặp phải một số câu hỏi. Bạn có thể muốn hỏi đồng nghiệp hoặc nhà phát triển, nhưng nếu không có kinh nghiệm ứng dụng thực tế, rất khó để tìm được câu trả lời. Với nhiều năm kinh nghiệm phát triển các ứng dụng producer, consumer, Streams và Connect, tôi mong muốn cung cấp câu trả lời cho sinh viên. Không chỉ đơn thuần là giảng bài, tôi sẽ tương tác với bạn thông qua các buổi hỏi đáp và cộng đồng để giải đáp những thách thức và câu hỏi bạn gặp phải trong quá trình phát triển ứng dụng Kafka.
CCDAK (Conflunet Certified Developer for Apache Kafka) là chứng chỉ Confluent xác nhận chuyên môn phát triển ứng dụng Kafka. Dựa trên sự chuẩn bị và kinh nghiệm thi CCDAK, khóa học cung cấp các bài kiểm tra giải quyết các câu hỏi thường gặp trong kỳ thi chứng chỉ. Học viên có thể học từng phần và làm bài kiểm tra. Họ cũng có thể xem lại đáp án và giải thích dưới dạng video. Kiến thức thu được thông qua quá trình này sẽ rất hữu ích cho việc chuẩn bị cho các câu hỏi phỏng vấn trong tương lai.
1. Giải thích các khái niệm cơ bản của Kafka
Giải thích rõ ràng các khái niệm và thuật ngữ được sử dụng trong Kafka.
2. Vận hành cụm Kafka
Tìm hiểu về các loại và phương pháp vận hành cụm Kafka.
3. Hoạt động CLI của Apache Kafka
Tìm hiểu và thực hành các tập lệnh được sử dụng phổ biến nhất để phát triển ứng dụng Kafka.
4. Phát triển ứng dụng Kafka Producer
Chúng ta sẽ xem xét cấu trúc bên trong, các tùy chọn chính và mã của nhà sản xuất. Chúng ta cũng sẽ xem xét hành vi của nó đối với các bộ phân vùng và độ tin cậy của việc truyền dữ liệu cho từng tùy chọn.
5. Phát triển ứng dụng Kafka Consumer
Chúng ta sẽ xem xét cấu trúc bên trong, các tùy chọn chính và mã của bộ phận tiêu thụ. Bắt đầu với nhóm tiêu thụ, chúng ta cũng sẽ tìm hiểu chi tiết về giá đỡ tiêu thụ, thành phần thiết yếu nhất cho hoạt động của bộ phận tiêu thụ.
6. Nhà sản xuất bất khả phân, nhà sản xuất giao dịch và người tiêu dùng
Tìm hiểu cách sử dụng nhà sản xuất/người tiêu dùng giao dịch, có tính bất biến, thay vì nhà sản xuất/người tiêu dùng mặc định và tìm hiểu cách sử dụng chúng.
7. Luồng Kafka
Chúng ta sẽ khám phá các khái niệm, tùy chọn chính và mã cho các ứng dụng Streams, cung cấp khả năng xử lý luồng mạnh mẽ.
8. Kết nối Kafka
Chúng ta sẽ khám phá các khái niệm về kết nối, cùng với mã, được sử dụng để phát triển và vận hành các đường ống dữ liệu lặp đi lặp lại.
H. Tôi có cần phải mua sách [Lập trình ứng dụng Apache Kafka với Java] để tham gia khóa học này không?
Các kỹ thuật và mã được trình bày ở đây dựa trên "Lập trình Ứng dụng Apache Kafka với Java". Tuy nhiên, vì tất cả tài liệu được trình bày trong khóa học này đều ở định dạng PDF, bạn không nhất thiết phải mua sách. Nếu bạn muốn tìm hiểu và xem lại nội dung bổ sung (MirrorMaker2, AWS MSK, v.v.), việc mua sách này là một lựa chọn tuyệt vời.
H. Sinh viên không chuyên ngành cũng có thể tham gia khóa học này không?
Khóa học này giải thích một cách trung thực các khái niệm cơ bản của Apache Kafka và đi sâu vào các tính năng và tùy chọn cần thiết cho môi trường phát triển thực tế. Hơn nữa, khóa học được thiết kế sao cho ngay cả những người chưa quen thuộc với các phần mềm hoặc nền tảng dữ liệu lớn khác cũng có thể dễ dàng nắm bắt các khái niệm, rất lý tưởng cho những người không chuyên ngành đang tìm kiếm sự nghiệp kỹ sư dữ liệu.
H. Tại sao nên học bằng Java? Tôi vẫn có thể học mà không cần biết Java chứ?
Các thư viện chính thức được cung cấp và hỗ trợ bởi Apache Kafka mã nguồn mở là Java. Hơn nữa, việc phát triển Kafka Connect và Kafka Streams yêu cầu các thư viện Java chính thức làm phụ thuộc. Do đó, để thực sự đánh giá cao giá trị của Apache Kafka mã nguồn mở, bạn phải phát triển các ứng dụng dựa trên Java (producer, consumer, Stream và Connect). Các thư viện của bên thứ ba (ở các ngôn ngữ khác) không cung cấp cùng chức năng và không thể đảm bảo khả năng tương thích hoàn hảo, vì vậy khóa học này được viết bằng Java.
Đừng lo lắng nếu bạn không quen với Java. Mã được giải thích từng dòng một, vì vậy bạn có thể dễ dàng theo dõi.
H. Tôi có cần MacBook để tham gia khóa đào tạo không?
Không, bạn có thể thực hành trên các hệ điều hành khác ngoài MacBook. Mặc dù bài giảng và môi trường thực hành được xây dựng trên MacBook, các tập lệnh được thiết kế để chạy trên Windows hoặc Linux, miễn là JVM đang chạy. Vì vậy, đừng lo lắng ngay cả khi bạn không có MacBook.
Học viên sử dụng Windows có thể cần thiết lập môi trường phát triển WSL để chạy các tập lệnh shell. Để biết hướng dẫn chi tiết, vui lòng tham khảo mục Thiết lập Môi trường Phát triển WSL (liên kết) .
H. Yêu cầu cấu hình máy tính nào cho khóa đào tạo?
Để chạy ZooKeeper và Kafka broker cục bộ và thực hiện các bài tập, bạn cần máy tính xách tay hoặc máy tính để bàn có ít nhất 8GB bộ nhớ. Khuyến nghị CPU i3 (3GHz) trở lên. Cuối cùng, bạn cần ít nhất 1GB dung lượng trống trên ổ SSD hoặc ổ cứng để lưu trữ.
Khóa học này dành cho ai?
Nhà phát triển mới muốn biết các khái niệm cơ bản của Apache Kafka
Nhà phát triển phụ trợ muốn trở thành kỹ sư dữ liệu
Kỹ sư dữ liệu muốn nghiên cứu kiến trúc dựa trên Kafka để xử lý dữ liệu truyền phát
Cần biết trước khi bắt đầu?
Kiến thức về ngữ pháp Java 1.8 trở lên
Sử dụng tập lệnh shell (Bash hoặc Zsh)
12,495
Học viên
470
Đánh giá
177
Trả lời
4.9
Xếp hạng
2
Các khóa học
#Kafka #Streaming #DataEngineer
Tất cả
105 bài giảng ∙ (13giờ 13phút)
Tài liệu khóa học:
Tất cả
125 đánh giá
4.9
125 đánh giá
Đánh giá 7
∙
Đánh giá trung bình 5.0
Đánh giá 2
∙
Đánh giá trung bình 5.0
Đánh giá 2
∙
Đánh giá trung bình 5.0
Đánh giá 2
∙
Đánh giá trung bình 5.0
Đánh giá 153
∙
Đánh giá trung bình 5.0
3.462.471 ₫
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!