本章将介绍 RAG 应用的核心技术组件,并基于智能客服助手案例的需求进行技术栈的选择和整体架构的设计。我们将深入探讨 RAG 的三大核心组成部分——检索模块、生成模块和编排优化层——以及它们各自的关键技术。随后,我们将针对我们智能客服助手的实际需求,评估并选择适合的技术栈,最终勾勒出整个系统的宏观架构蓝图。
2.1 RAG 核心组件概述
检索增强生成(RAG)系统之所以强大,在于它巧妙地结合了信息检索的精准性与大型语言模型(LLM)的生成能力。要理解 RAG,我们首先需要拆解其核心的三个模块:检索模块、生成模块以及将两者有机结合并优化的编排与优化模块。
检索模块 (Retrieval)
检索模块是 RAG 的“眼睛”和“图书馆管理员”,它的核心任务是根据用户的查询,从庞大的知识库中快速、准确地找到最相关的信息片段(通常称为“上下文”或“证据”)。
-
向量数据库(Vector Database):
- 概念: