Tất cả về phát triển AI Agent học qua việc tạo chatbot (FastAPI, RAG, Vector, LangChain, sLLM/Fine-tuning)
Bạn sẽ được học về RAG, VectorDB, LangChain, OpenAI, sLLM và Fine-tuning, bao gồm tất cả các công nghệ liên quan đến AI quan trọng nhất ở thời điểm hiện tại.
11 học viên đang tham gia khóa học này
Độ khó Nhập môn
Thời gian Không giới hạn
Bạn sẽ nhận được điều này sau khi học.
Hiểu về toàn bộ vòng đời của AI Agent, bao gồm lập kế hoạch, thiết kế và phát triển.
Nguyên lý về Vector DB và độ tương đồng Vector
Ứng dụng và thực hành LangChain trong RAG
Tìm hiểu và thực hành về sLLM (llama) và fine-tuning (lora)
Bạn sẽ trực tiếp triển khai dịch vụ chatbot trung tâm khách hàng cho trung tâm mua sắm, đồng thời học về quy trình dịch vụ thực tế bao gồm RAG, Vector DB, LangChain, sLLM và LoRA Fine-tuning - những yếu tố quan trọng nhất trong dịch vụ AI hiện nay
Backend
- - FastAPI
- - PostgreSQL
AI
- - RAG
- - LangChain
- - pgVector
- - OpenAI
sLLM &
Tinh chỉnh (Fine-tune)
- - Ollama/Llama3.2
- - PEFT/LoRA
- - RunPod
- - Hugging Face
Không chỉ dừng lại ở việc “tạo một chatbot đơn thuần”. Chúng ta sẽ giả định một trung tâm khách hàng của trung tâm thương mại thực tế để thiết kế các lộ trình xử lý khác nhau tùy theo tính chất của câu hỏi.
FastAPI + OpenAI
- Hiểu cấu trúc dự án FastAPI
- Kết nối OpenAI API và sử dụng Tool Calling
RAG + LangChain
- Cơ bản về RAG, nguyên lý của Vector và độ tương đồng Cosine, Embedding và Vector DB
- Xây dựng pipeline tải tài liệu/chia nhỏ (chunking)/nhúng (embedding)/lưu trữ/tìm kiếm (Retriever) bằng LangChain
Chiến lược tối ưu hóa RAG (Nâng cao)
- Quản lý lịch sử hội thoại để phản ánh ngữ cảnh của các câu hỏi tiếp theo (Window memory)
- Tiết kiệm chi phí token + tối ưu hóa độ trễ phản hồi bằng Semantic Caching (Redis Stack). Nếu là câu hỏi tương tự, phản hồi từ bộ nhớ đệm mà không cần gọi LLM.
- Giới thiệu khái niệm tìm kiếm hybrid (Dense + Sparse/BM25) và kết hợp xếp hạng (RRF)
sLLM + Fine-tuning
- Thông tin nhạy cảm có thể gặp rủi ro khi gọi các LLM thương mại bên ngoài, nên việc áp dụng sLLM cục bộ (local) là cần thiết.
- Chạy mô hình Llama bằng Ollama và tạo phản hồi sau khi gọi từ máy chủ dưới dạng API
- Tăng cường độ chính xác của mô hình sLLM bằng phương pháp fine-tuning PEFT/LoRA
- Tạo adapter và sử dụng Hugging Face để tải lên mô hình đã hợp nhất
- Thực hành từ huấn luyện, tải lên đến kiểm tra trong môi trường RunPod GPU
sLLM
Fine-tuning
Khuyến nghị cho
những người này
Khóa học này dành cho ai?
Các nhà hoạch định, PM, v.v., những người muốn tìm hiểu về các xu hướng AI mới nhất dưới góc độ kỹ thuật.
Nhà phát triển AI mới bắt đầu, hoàn toàn chưa có kiến thức cơ bản về VectorDB, RAG, LangChain, sLLM và Fine-tuning.
Những nhà phát triển đã biết về RAG, LangChain nhưng cần các chiến lược AI Agent chuyên sâu về tối ưu hóa tìm kiếm, bộ nhớ đệm (caching), tiết kiệm token, v.v.
Xin chào
Đây là bradkim
Xác minh Inflearn
Xác minh sự nghiệp
3,677
Học viên
399
Đánh giá
133
Trả lời
4.9
Xếp hạng
11
Các khóa học
💪💪💪Chuyên gia có kinh nghiệm thực tế và giảng dạy 💪💪💪
Xin chào, tôi là Kim Seong-uk. Tôi đã tốt nghiệp Đại học Yonsei và từng làm việc với tư cách là kỹ sư phần mềm tại các tập đoàn lớn cũng như startup. Hiện tại, tôi đang là giảng viên chuyên nghiệp đào tạo doanh nghiệp/bootcamp. Với tư cách là một giảng viên có cả kinh nghiệm thực tế lẫn kinh nghiệm giảng dạy, tôi sẽ truyền đạt những kiến thức cốt lõi mà các bạn nhất định phải biết một cách dễ hiểu nhất.
Hồ sơ: https://www.linkedin.com/in/seongukkim
Liên hệ đào tạo doanh nghiệp: ksg39412@naver.com
Chương trình giảng dạy
Tất cả
26 bài giảng ∙ (8giờ 26phút)
6. Tổng quan về RAG
11:00
9. Nhúng (Embedding)
16:21
10. Vector DB
13:13
Đánh giá
Khóa học khác của bradkim
Hãy khám phá các khóa học khác của giảng viên!
Khóa học tương tự
Khám phá các khóa học khác trong cùng lĩnh vực!





![Chỉ đúng 1 tiếng! Tự tạo "Trợ lý AI của riêng tôi" cài đặt ngay trên máy tính (Antigravity Vibe Coding) [Cung cấp mã nguồn]Hình thu nhỏ khóa học](https://cdn.inflearn.com/public/files/courses/340332/cover/ai/3/e87ee52b-1099-42db-a384-64ab8c725470.png?w=420)

