Xây dựng RAG pipeline production-ready với LangChain, pgvector và FastAPI
Kiến trúc, code mẫu và checklist để biến demo RAG thành hệ thống có thể vận hành trong doanh nghiệp.
Kiến trúc, code mẫu và checklist để biến demo RAG thành hệ thống có thể vận hành trong doanh nghiệp.
Cách phân biệt fine-tuning, RAG và prompt engineering để chọn hướng tối ưu cho bài toán thật.
Phân tích khi nào multi-agent giúp chia vai và kiểm tra chéo, khi nào chỉ làm hệ thống phức tạp hơn.
Từ faithfulness đến context precision: cách đo chất lượng RAG mà không chỉ nhìn demo bằng mắt.
Cách tính chi phí theo token, latency, cache và chất lượng tiếng Việt để chọn model hợp lý.
Case thực tế từ pipeline hỏi đáp chính sách công ty.
Từ endpoint đầu tiên đến logging và citation.