Phản hồi sẽ trở nên chậm đi
Nếu bạn cứ mù quáng thêm vào các giai đoạn tìm kiếm, xếp hạng lại (re-ranking), tóm tắt và xác thực, độ chính xác có thể tăng lên nhưng độ trễ của dịch vụ sẽ tăng vọt.
Học tập các nguyên lý cốt lõi và triển khai thực tế của Classic RAG, Graph RAG và Agentic RAG. Thiết kế hệ thống định tuyến động (dynamic routing) giúp tối ưu hóa hiệu suất token và độ trễ, đồng thời xây dựng hệ thống bộ nhớ dài hạn kết hợp giữa suy luận mạng lưới quan hệ của GraphRAG và vòng lặp tự đánh giá của Agentic RAG. Đây là khóa học hoàn thiện năng lực thiết kế kiến trúc RAG cao cấp, có thể áp dụng ngay vào công việc thực tế.
31 học viên
Độ khó Trung cấp trở lên
Thời gian Không giới hạn
Đánh giá từ những học viên đầu tiên
5.0
tata
Thật tuyệt vời khi có thể hiểu được sự thay đổi mô hình của RAG và khái niệm hệ thống hybrid, đồng thời học hỏi thêm các phương pháp tối ưu hóa RAG.
5.0
유진
Đây là một bài giảng tuyệt vời giúp bạn hiểu rõ về các xu hướng mới của RAG cũng như toàn bộ kiến trúc của nó. Lúc đầu, tôi cứ gật gù hiểu hết trong đầu, nhưng khi kết thúc mỗi phần, tôi lại cảm thấy trống rỗng và tự hỏi "Ơ, phải làm thế nào nhỉ?". Tuy nhiên, khi thấy giảng viên phản hồi và cập nhật ngay lập tức những ý kiến đóng góp cũng như yêu cầu cải thiện của mình, tôi một lần nữa cảm nhận được đây là một giảng viên giỏi và một khóa học chất lượng. Mỗi phần đều được bổ sung thêm mã thực hành và nội dung riêng biệt nên tôi càng mong đợi hơn vào bài giảng này. Nội dung rất hay, giải thích dễ hiểu và phản hồi cũng rất nhanh chóng, vì vậy tôi cực kỳ đề xuất các bạn nên tham gia khóa học này!
Sự khác biệt về kiến trúc giữa Classic, Graph, Agentic RAG và đánh giá kịch bản sử dụng tối ưu
Triển khai hệ thống định tuyến động cân nhắc chi phí token và độ trễ
Triển khai hệ thống bộ nhớ dài hạn kết hợp GraphRAG và xMemory
Đây là khóa học thực hành giúp bạn hiểu rõ sự khác biệt giữa Classic RAG, Graph RAG, Agentic RAG, đồng thời triển khai hệ thống định tuyến động (dynamic routing) để lựa chọn pipeline tối ưu theo đặc điểm của truy vấn, cùng kiến trúc bộ nhớ dài hạn dựa trên GraphRAG+xMemory.
Hệ thống RAG không chỉ đơn thuần là đưa tài liệu vào Vector DB rồi tìm kiếm là xong. Trong dịch vụ thực tế, tùy thuộc vào tính chất câu hỏi, cấu trúc tài liệu, chi phí, tốc độ phản hồi và độ sâu suy luận mà cần có những thiết kế hoàn toàn khác nhau.
Nếu bạn cứ mù quáng thêm vào các giai đoạn tìm kiếm, xếp hạng lại (re-ranking), tóm tắt và xác thực, độ chính xác có thể tăng lên nhưng độ trễ của dịch vụ sẽ tăng vọt.
Cách tiếp cận đưa quá nhiều ngữ cảnh vào mọi câu hỏi tuy đơn giản, nhưng khó có thể tránh khỏi chi phí vận hành và lãng phí ngữ cảnh.
Chỉ dựa vào tìm kiếm tương đồng đơn thuần thì khó có thể xử lý đầy đủ mối quan hệ giữa nhiều tài liệu, nguyên nhân và kết quả, cũng như bối cảnh dài hạn.
Đây là hệ thống xác định tính chất của câu hỏi và lựa chọn chiến lược tìm kiếm, suy luận, xác minh phù hợp nhất. Khóa học này sẽ cùng bạn tìm hiểu về các tiêu chuẩn đánh giá và cấu trúc triển khai đó.
Thay vì chỉ sao chép các ví dụ triển khai đơn giản, khóa học tập trung vào việc xây dựng tư duy thiết kế để bạn có thể tự mình quyết định nên chọn cấu trúc RAG nào trong từng tình huống cụ thể.
Có thể phân biệt rõ ràng ưu nhược điểm và các kịch bản sử dụng phù hợp của Classic, Graph và Agentic RAG.
Thiết kế cấu trúc định tuyến hỗn hợp (hybrid routing) để lựa chọn giữa tìm kiếm nhanh, suy luận sâu hoặc vòng lặp tự đánh giá tùy theo loại câu hỏi.
Học hệ thống RAG nâng cao kết hợp GraphRAG và xMemory để trang bị cấu trúc bộ nhớ liên tục và suy luận mạng lưới quan hệ.
Đây là cấu trúc cơ bản giúp tạo câu trả lời nhanh chóng dựa trên tìm kiếm vector và chèn ngữ cảnh. Nó có thế mạnh trong các câu hỏi đơn giản, FAQ và phản hồi dựa trên tài liệu.
Trích xuất các thực thể và mối quan hệ từ văn bản để tạo lập biểu đồ tri thức, đồng thời tận dụng các mối liên kết giữa các tài liệu để thực hiện suy luận sâu hơn.
AI đánh giá kết quả tìm kiếm, nếu thiếu sẽ tìm kiếm lại, và là một vòng lặp tìm kiếm tự trị giúp tự kiểm tra chất lượng câu trả lời.
Không phải tất cả các câu hỏi đều được xử lý theo cùng một cách. Chúng tôi thiết kế một cấu trúc giúp cân bằng giữa chi phí và chất lượng bằng cách phân loại các câu hỏi cần trả lời nhanh, các câu hỏi cần suy luận mối quan hệ và các câu hỏi cần tự đánh giá.
Đánh giá độ phức tạp của câu hỏi, ngữ cảnh cần thiết và chiều sâu suy luận.
Lựa chọn linh hoạt lộ trình phù hợp trong số Classic, Graph và Agentic.
Thực hiện tìm kiếm tài liệu, khám phá mạng lưới quan hệ và vòng lặp tự đánh giá phù hợp với từng tình huống.
Duy trì chất lượng câu trả lời trong khi giảm lượng token sử dụng và thời gian trễ.
Phù hợp với những ai muốn giải quyết các vấn đề về độ chính xác, chi phí token, thời gian trễ của hệ thống RAG hiện tại và muốn thiết kế cấu trúc tìm kiếm - suy luận tốt hơn.
Phù hợp cho những ai muốn nâng cao năng lực thiết kế kiến trúc cho các hệ thống quản lý tri thức phức tạp, hệ thống tìm kiếm tài liệu và các dịch vụ dựa trên LLM.
RAG 기술의 차이를 이해하고, 프로덕션 레벨 LLM 제품에서 어떤 구조가 필요한지 판단하고 싶은 분께 추천합니다.
Tóm tắt về bộ ba nan đề (trilemma) của RAG, sự khác biệt trong cấu trúc giữa Classic/Graph/Agentic RAG và sự cần thiết của bộ định tuyến hybrid (hybrid router).
Mở rộng RAG cơ bản lên dạng thực tiễn thông qua Advanced Classic RAG, cắt giảm token (token diet) và các tiêu chuẩn áp dụng GraphRAG.
Trích xuất đồ thị tri thức từ văn bản và học cấu trúc Hybrid Searcher tận dụng mạng lưới quan hệ.
Phần này đề cập đến vòng lặp cốt lõi của Agentic RAG, nơi hệ thống tự đánh giá kết quả tìm kiếm và tìm lại những thông tin còn thiếu.
Kết hợp GraphRAG và xMemory để xây dựng cấu trúc RAG nâng cao có khả năng ghi nhớ dài hạn và suy luận mối quan hệ.
Mở rộng góc nhìn về việc thiết kế cách tổ chức kiến thức nào, theo phương thức nào và tìm kiếm - suy luận thông qua lộ trình nào trong môi trường thực tế.
Tìm kiếm nhanh chóng với Classic RAG, thấu hiểu các mối quan hệ với Graph RAG, tự đánh giá với Agentic RAG và thiết kế trí nhớ dài hạn với xMemory. Khóa học này sẽ giúp bạn có cái nhìn sắc bén về hệ thống RAG dưới góc độ kiến trúc thực tiễn.
Khóa học này dành cho ai?
Kỹ sư AI cần tối ưu hóa hiệu suất của hệ thống RAG
Nhà phát triển backend thiết kế hệ thống quản lý tri thức phức tạp
Quản lý sản phẩm AI (AI Product Manager) đang tìm cách xây dựng các ứng dụng LLM ở cấp độ sản xuất (production level)
Cần biết trước khi bắt đầu?
Hiểu các khái niệm cơ bản về Prompt Engineering và RAG
Kinh nghiệm tích hợp API LLM dựa trên Python
Cách sử dụng cơ bản của cơ sở dữ liệu vectơ (Pinecone, Weaviate, v.v.)
Xác minh sự nghiệp
1,169
Học viên
108
Đánh giá
30
Trả lời
4.8
Xếp hạng
14
Các khóa học
Dựa trên kinh nghiệm và trải nghiệm sẵn có, tôi sẽ chia sẻ những bí quyết và mẹo hay trong khi vẫn bắt kịp các xu hướng của thế giới. Rất mong nhận được sự ủng hộ của mọi người!
Website hồ sơ: https://codebridge-ai.pages.dev
Liên hệ: codebridge747@gmail.com
🤖👾 Chương trình thạc sĩ AI tại Mỹ
🏗 Nhà phát triển năm thứ 7 tại tập đoàn IT lớn
📱 Đang phát triển và vận hành 14 ứng dụng Android, 7 ứng dụng iOS cùng nhiều trang web khác nhau
[Tiếng Anh]
Dựa trên những kinh nghiệm thực tế của bản thân, tôi muốn chia sẻ những bí quyết và mẹo nhỏ mà mình đúc kết được trong khi theo sát các xu hướng trên thế giới. Rất mong nhận được sự ủng hộ của các bạn!
Profile : https://codebridge-ai.pages.dev
Liên hệ: codebridge747@gmail.com
Nhà phát triển tại một tập đoàn IT lớn ở Hàn Quốc (6 năm +)
Bằng Cử nhân chuyên ngành Kỹ thuật Máy tính
Tất cả
30 bài giảng ∙ (2giờ 54phút)
Tài liệu khóa học:
Tất cả
3 đánh giá
4.7
3 đánh giá
Đánh giá 9
∙
Đánh giá trung bình 5.0
Đánh giá 10
∙
Đánh giá trung bình 5.0
Đã chỉnh sửa
5
Đây là một bài giảng tuyệt vời giúp bạn hiểu rõ về các xu hướng mới của RAG cũng như toàn bộ kiến trúc của nó. Lúc đầu, tôi cứ gật gù hiểu hết trong đầu, nhưng khi kết thúc mỗi phần, tôi lại cảm thấy trống rỗng và tự hỏi "Ơ, phải làm thế nào nhỉ?". Tuy nhiên, khi thấy giảng viên phản hồi và cập nhật ngay lập tức những ý kiến đóng góp cũng như yêu cầu cải thiện của mình, tôi một lần nữa cảm nhận được đây là một giảng viên giỏi và một khóa học chất lượng. Mỗi phần đều được bổ sung thêm mã thực hành và nội dung riêng biệt nên tôi càng mong đợi hơn vào bài giảng này. Nội dung rất hay, giải thích dễ hiểu và phản hồi cũng rất nhanh chóng, vì vậy tôi cực kỳ đề xuất các bạn nên tham gia khóa học này!
Cảm ơn bạn rất nhiều vì những lời khen ngợi! Tôi cảm thấy công sức làm bài giảng thật xứng đáng! 😂 Mặc dù vẫn còn nhiều thiếu sót, nhưng tôi sẽ cố gắng mang đến những bài giảng và tài liệu tốt hơn nữa trong tương lai. Xin cảm ơn bạn!
Đánh giá 3
∙
Đánh giá trung bình 4.7
4
Nhìn chung, tôi thấy đây là một bài giảng rất hay. Đặc biệt, tôi đã phát triển dịch vụ RAG nhận câu trả lời bằng cách truy xuất với BM25+Vector, và dựa trên bài giảng này, tôi nghĩ mình có thể cải thiện nó tốt hơn nữa. Tuy nhiên, điều tôi cảm thấy hơi tiếc là hy vọng có thêm nhiều kỹ thuật về embedding hơn. Tôi đang quản lý các tài liệu văn bản hoặc markdown bằng cách chia nhỏ (chunking) và lưu trữ vào cơ sở dữ liệu vector Qdrant. Tôi đã hy vọng có thêm các mẹo nhỏ và bí quyết về việc làm thế nào để chia nhỏ và lưu trữ dữ liệu vector một cách hiệu quả, cũng như cách truy xuất dữ liệu tối ưu nhất. Dù vậy, tôi rất vui vì đã được học những kỹ thuật tốt như GraphRAG và Agentic RAG~
Cảm ơn bạn! Rất vui vì thông tin này hữu ích với bạn. Về việc lưu trữ dữ liệu chunk và vector, tôi sẽ cập nhật vào bài giảng này ngay khi chuẩn bị xong tài liệu. :)
Hãy khám phá các khóa học khác của giảng viên!
Khám phá các khóa học khác trong cùng lĩnh vực!
Giảm 25% cho thành viên mới
1.719.974 ₫
25%
2.293.304 ₫