从零开始搭建 RAG 智能问答系统：一个完整的实战案例

本文链接：https://blog.csdn.net/zhishi0000/article/details/147226517

你是否曾经为处理大量文档而烦恼？是否希望有一个智能助手，能够快速回答你关于文档的任何问题？今天，我将分享一个完整的实战案例，教你如何从零开始搭建一个基于 RAG 技术的智能问答系统。

引言

还记得上次为了找一个文档中的关键信息，花了整整一个下午翻找的经历吗？或者为了回答客户的问题，不得不反复查阅产品手册的困扰？在信息爆炸的时代，如何高效地管理和利用文档资源，已经成为每个企业和个人都面临的挑战。

今天，我要分享一个解决方案：使用 RAG（检索增强生成）技术构建智能问答系统。这个系统不仅能理解你的问题，还能从海量文档中快速找到相关信息，给出准确的答案。更重要的是，它还能告诉你答案的来源，让你对结果更有信心。

项目亮点

🚀 快速部署：从环境搭建到系统上线，仅需几小时
📚 智能检索：支持 Word、PDF 等多种格式文档
🎯 精准回答：基于文档内容，给出准确答案
🔍 来源可溯：每个答案都附带参考来源
💡 优雅界面：美观的聊天界面，支持多种交互方式

### 你将学到什么

如何将 Word 文档转换为适合机器处理的格式
如何使用 RAGFlow 构建知识库
如何通过 API 实现智能问答功能
如何使用 Gradio 快速搭建美观的用户界面
如何处理各种异常情况和优化系统性能

### 项目效果预览

想象一下，你只需要在聊天框中输入问题，系统就能立即从你的文档库中找到相关信息，并给出准确的答案。比如：

“我们公司的产品保修期是多久？”
“最新的价格政策是什么？”
“如何申请售后服务？”

系统不仅能回答这些问题，还会告诉你答案来自哪份文档的哪个部分，让你对答案的可信度一目了然。

### 适合人群

企业知识库管理者
客服团队负责人
技术文档维护人员
对 AI 应用感兴趣的开发者
想要提升工作效率的职场人士

接下来，我将带你一步步实现这个系统。无论你是技术小白还是资深开发者，都能跟着教程轻松上手。让我们开始吧！

第一部分：项目准备

1. 环境搭建

在开始项目之前，我们需要准备好开发环境。这个项目主要使用 Python 语言开发，所以首先需要确保你的电脑上已经安装了 Python 环境。

Python 环境配置

如果你还没有安装 Python，可以从 Python 官网下载并安装最新版本。安装完成后，可以通过以下命令验证安装是否成功：

python --version

#### 依赖包管理

为了管理项目依赖，我们使用 requirements.txt 文件。这个文件列出了项目所需的所有 Python 包及其版本。以下是我们的项目依赖：

requests==2.31.0
python-dotenv==1.0.0
gradio==4.19.2

你可以通过以下命令安装这些依赖：

pip install -r requirements.txt

#### 环境变量配置

为了安全地管理 API 密钥和其他敏感信息，我们使用 .env 文件存储环境变量。这个文件不应该提交到版本控制系统中。以下是 .env 文件的内容：

RAGFLOW_API_KEY=your_api_key_here 
RAGFLOW_API_URL=https://api.ragflow.com
CHAT_ASSISTANT_ID=your_chat_assistant_id_here

请将 your_api_key_here RAGFLOW_API_URL your_chat_assistant_id_here 替换为你的实际 API 密钥和聊天助手 ID。

分别在这些地方找：

RAGFLOW_API_KEY

RAGFLOW_API_URL

CHAT_ASSISTANT_ID

2. 文档处理与知识库构建

在实际项目中，我们经常需要处理各种格式的文档，特别是 Word 文档。这些文档通常包含文字和图片，如何有效地处理这些文档并将其导入到知识库中，是一个重要的挑战。

Word 文档转 PDF 的必要性

在处理文档时，我们选择将 Word 文档转换为 PDF 格式，主要有以下几个原因：

格式一致性：PDF 格式在不同平台上显示一致，避免了格式混乱的问题
文本提取：PDF 文件更容易进行文本提取，特别是对于包含复杂格式的文档
图片处理：PDF 中的图片通常以更标准的方式存储，便于提取和处理
安全性：PDF 文件可以设置权限，防止未经授权的修改

#### RAGFlow 知识库介绍

RAGFlow 是一个强大的知识库管理平台，它提供了丰富的功能来帮助我们构建和管理知识库：

文档上传：支持多种格式的文档上传，包括 PDF、Word、Excel 等
文档解析：提供多种解析方式，可以根据文档类型选择最适合的解析方式
知识检索：基于向量数据库的快速检索，能够准确找到相关内容
知识更新：支持知识库的增量更新，保持知识的时效性

Manual 解析方式的选择

在处理复杂的图文混排文档时，我们选择了 Manual 解析方式，主要有以下考虑：

精确控制：Manual 解析方式允许我们精确控制解析过程，确保重要内容不被遗漏
格式保持：能够更好地保持原始文档的格式和结构
图片处理：对于包含大量图片的文档，Manual 解析方式能够更好地处理图片内容
自定义规则：可以根据文档特点设置自定义解析规则，提高解析质量

知识库构建步骤

构建知识库的过程可以分为以下几个步骤：

文档上传：将转换好的 PDF 文档上传到 RAGFlow 平台

解析方式配置：选择 Manual 解析方式，并配置相关参数

参数优化：根据文档特点调整解析参数，如分块大小、重叠度等
结果验证：检查解析结果，确保内容被正确提取

图文混排文档处理

处理图文混排文档是一个具有挑战性的任务，我们需要特别关注以下几个方面：

文字提取：确保所有文字内容被正确提取，包括表格、列表等特殊格式
图片处理：提取文档中的图片，并保持其与文字的关系
格式保持：尽量保持原始文档的格式和结构，便于后续检索和理解

最佳实践与经验总结

在文档处理和知识库构建过程中，我们总结了一些最佳实践：

文档预处理：在上传前对文档进行预处理，如去除水印、调整格式等
分块策略：根据文档内容特点选择合适的分块策略，如按段落、按章节等
参数调优：通过多次尝试和验证，找到最适合的解析参数
质量验证：建立质量验证机制，确保解析结果的准确性

第二部分：技术实现

在完成知识库构建后，我们需要通过 API 与 RAGFlow 平台进行交互，实现智能问答功能。

RAGFlow API 介绍

RAGFlow 提供了丰富的 API，主要包括以下几类：

会话管理 API：用于创建和管理聊天会话
问答 API：用于发送问题和获取答案
知识库管理 API：用于管理知识库和文档

在本项目中，我们主要使用会话管理 API 和问答 API。

会话管理实现

会话管理是智能问答系统的重要组成部分，它能够保持对话的上下文，提供更连贯的问答体验。以下是会话管理的实现代码：

def create_session():
    """Create a new chat session with RAGFlow"""
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    response = requests.post(
        f"{API_URL}/api/v1/chats/{CHAT_ASSISTANT_ID}/sessions",
        headers=headers,
        json={"name": "Gradio Chat Session"}
    )
    
    print("Create Session Response:", json.dumps(response.json(), indent=2))
    if response.status_code == 200:
        return response.json()['data']['id']
    else:
        raise Exception(f"Failed to create session: {response.text}")

这段代码创建了一个新的聊天会话，并返回会话 ID。会话 ID 将用于后续的问答请求。

错误处理机制

在实际应用中，错误处理是非常重要的。我们需要处理各种可能的错误情况，如网络错误、API 错误等。以下是错误处理的实现代码：

def chat_with_assistant(message, history, session_id):
    """Send message to RAGFlow assistant and get response"""
    headers = {
        'Authorization': f'Bearer {API_KEY}',
        'Content-Type': 'application/json'
    }
    data = {
        "question": message,
        "stream": False,
        "session_id": session_id
    }
    try:
        response = requests.post(
            f"{API_URL}/api/v1/chats/{CHAT_ASSISTANT_ID}/completions",
            headers=headers,
            json=data
        )
        if response.status_code != 200:
            return f"Error: API returned status code {response.status_code}\nResponse: {response.text}"
        response_data = response.json()
        print("Chat Response:", json.dumps(response_data, indent=2))
        if response_data.get('code') == 0 and response_data.get('data'):
            answer = response_data['data'].get('answer', '')
            references = response_data['data'].get('reference', {})
            
            # Format response with references if available
            formatted_response = answer
            if references and references.get('chunks'):
                formatted_response += "\n\nReferences:\n"
                for i, chunk in enumerate(references['chunks'], 1):
                    formatted_response += f"{i}. {chunk['document_name']}: {chunk['content'][:200]}...\n"
            return formatted_response
        else:
            return "Error: Invalid response format from API"
    except requests.exceptions.RequestException as e:
        return f"Error: Failed to connect to API - {str(e)}"
    except json.JSONDecodeError as e:
        return f"Error: Invalid JSON response - {str(e)}"
    except Exception as e:
        return f"Error: Unexpected error - {str(e)}"

这段代码包含了完整的错误处理机制，能够处理各种可能的错误情况，并返回友好的错误信息。

调试技巧分享

在 API 集成过程中，调试是非常重要的。以下是一些调试技巧：

\1. *打印 API 响应*：在开发阶段，打印 API 响应可以帮助我们了解 API 的行为

\2. *使用 Postman*：使用 Postman 等工具手动测试 API，可以更快地发现问题

\3. *日志记录*：在关键位置添加日志记录，便于追踪问题

\4. *异常捕获*：使用 try-except 语句捕获异常，避免程序崩溃

### 2. 用户界面开发

在完成 API 集成后，我们需要开发用户界面，让用户能够方便地与系统交互。我们选择使用 Gradio 框架来快速构建美观的用户界面。

#### Gradio 框架介绍

Gradio 是一个用于构建机器学习应用界面的 Python 库，它具有以下特点：

\1. *简单易用*：几行代码就能构建功能完整的界面

\2. *美观大方*：提供多种主题和样式，界面美观

\3. *功能丰富*：支持多种输入输出组件，满足各种需求

\4. *可定制性强*：可以根据需要自定义界面样式和布局

#### 聊天界面设计

我们设计了一个简洁美观的聊天界面，主要包括以下几个部分：

\1. *聊天窗口*：显示对话历史

\2. *消息输入框*：用于输入问题

\3. *发送按钮*：用于发送问题

\4. *清除按钮*：用于清除对话历史

\5. *新建会话按钮*：用于创建新的会话

#### 界面优化过程

在界面开发过程中，我们进行了多次优化，主要包括以下几个方面：

\1. *消息框大小调整*：增加消息框的高度，提供更好的输入体验

\2. *按钮布局优化*：将发送按钮移到消息框下方，布局更加合理

\3. *用户体验改进*：添加回车发送功能，提高使用效率

以下是界面优化的代码：

with gr.Blocks(title="RAGFlow Assistant", theme=gr.themes.Soft()) as demo:
    session_id = gr.State()
    
    with gr.Row():
        with gr.Column(scale=4):
            chatbot = gr.Chatbot(
                height=500,
                show_copy_button=True,
                bubble_full_width=False,
                avatar_images=(None, "https://api.dicebear.com/7.x/bottts/svg?seed=ragflow"),
                show_label=False
            )
            
            with gr.Column():
                msg = gr.Textbox(
                    label="Message",
                    placeholder="Type your message here...",
                    lines=5,
                    show_label=False,
                    container=False
                )
                with gr.Row():
                    submit = gr.Button("Send", variant="primary", size="lg")
                    clear = gr.Button("Clear Chat")
                    new_chat = gr.Button("New Chat")

这段代码创建了一个美观的聊天界面，包括聊天窗口、消息输入框和各种按钮。

#### 功能实现

在界面开发过程中，我们实现了多种功能，主要包括：

\1. *回车发送*：支持使用回车键发送消息

\2. *复制功能*：支持复制聊天内容

\3. *会话管理*：支持创建新会话和清除当前会话

\4. *错误提示*：友好地显示错误信息

以下是功能实现的代码：

def user(user_message, history):
    return "", history + [[user_message, None]]

def bot(history, session_id):
    if not session_id:
        session_id, _ = initialize_chat()
    user_message = history[-1][0]
    bot_message = chat_with_assistant(user_message, history, session_id)
    history[-1][1] = bot_message
    return history, session_id

submit.click(
    user,
    [msg, chatbot],
    [msg, chatbot]
).then(
    bot,
    [chatbot, session_id],
    [chatbot, session_id]
)

Allow sending message with Enter key
msg.submit(
    user,
    [msg, chatbot],
    [msg, chatbot]
).then(
    bot,
    [chatbot, session_id],
    [chatbot, session_id]
)

clear.click(lambda: None, None, chatbot, queue=False)
new_chat.click(
    initialize_chat,
    None,
    [session_id, chatbot]
)

这段代码实现了各种交互功能，包括发送消息、接收回复、清除会话和创建新会话。

## 第三部分：项目亮点

### 1. 技术亮点

在这个项目中，我们实现了多个技术亮点，主要包括：

#### 完整的错误处理

我们实现了完整的错误处理机制，能够处理各种可能的错误情况，如网络错误、API 错误等。这不仅提高了系统的稳定性，还提供了友好的错误信息，提升了用户体验。

#### 优雅的会话管理

我们实现了优雅的会话管理机制，能够保持对话的上下文，提供更连贯的问答体验。用户可以通过新建会话按钮创建新的会话，也可以通过清除按钮清除当前会话。

#### 美观的用户界面

我们使用 Gradio 框架构建了美观的用户界面，包括聊天窗口、消息输入框和各种按钮。界面简洁大方，易于使用，提供了良好的用户体验。

#### 文档引用展示

我们的系统不仅能够回答问题，还能够展示答案的来源，包括文档名称和内容片段。这不仅提高了答案的可信度，还帮助用户了解答案的来源。

### 2. 实用价值

这个项目具有广泛的实用价值，可以应用于多个场景：

#### 企业内部知识库问答

企业通常有大量的内部文档，如产品手册、技术文档、规章制度等。我们的系统可以帮助员工快速找到所需信息，提高工作效率。

#### 客服系统应用

客服人员需要处理大量的客户问题，我们的系统可以帮助他们快速找到答案，提高服务质量。

#### 教育培训场景

在教育培训场景中，我们的系统可以作为学习助手，帮助学生解答问题，提供学习资源。

#### 文档智能检索

我们的系统可以作为文档智能检索工具，帮助用户快速找到所需信息，提高文档利用效率。

## 第四部分：项目改进

### 1. 功能扩展

虽然我们的系统已经具备基本功能，但还有很大的改进空间。以下是一些功能扩展的方向：

#### 支持更多文档格式

目前，我们的系统主要支持 PDF 格式的文档。未来，我们可以扩展支持更多文档格式，如 Excel、PPT、HTML 等。

#### 用户认证系统

为了保护敏感信息，我们可以添加用户认证系统，只有授权用户才能访问系统。

#### 响应速度优化

我们可以通过多种方式优化响应速度，如使用缓存、优化检索算法等。

#### 交互功能增强

我们可以增强交互功能，如支持语音输入、图片上传等。

### 2. 性能优化

除了功能扩展，我们还可以进行性能优化，提高系统的运行效率：

#### 并发处理

我们可以实现并发处理，同时处理多个用户的请求，提高系统的吞吐量。

#### 缓存机制

我们可以实现缓存机制，缓存常用问题的答案，减少 API 调用次数，提高响应速度。

#### 资源利用

我们可以优化资源利用，如使用更高效的算法、减少内存占用等。

#### 响应时间

我们可以通过各种方式减少响应时间，如优化网络请求、减少处理步骤等。

## 结语

通过这个项目，我们实现了一个基于 RAG 技术的智能问答系统，能够从文档中提取信息，回答用户问题。这个系统不仅具有技术亮点，还具有广泛的实用价值。

在开发过程中，我们遇到了各种挑战，如文档处理、API 集成、界面开发等。通过不断尝试和优化，我们最终克服了这些挑战，实现了一个功能完善、性能优良的系统。

未来，我们将继续改进这个系统，添加更多功能，优化性能，提高用户体验。我们相信，这个系统将在各个领域发挥重要作用，帮助用户更高效地利用文档资源。

### 实践经验分享

在开发过程中，我们总结了一些实践经验：

\1. *文档预处理很重要*：良好的文档预处理可以提高解析质量

\2. *错误处理必不可少*：完整的错误处理可以提高系统稳定性

\3. *用户体验是关键*：良好的用户体验可以提高用户满意度

\4. *持续优化很重要*：系统需要不断优化，以适应新的需求和挑战

### 未来展望

未来，我们将继续改进这个系统，主要包括以下几个方面：

\1. *支持更多文档格式*：扩展支持更多文档格式

\2. *增强交互功能*：添加更多交互功能，如语音输入、图片上传等

\3. *优化性能*：通过各种方式优化性能，提高系统运行效率

\4. *扩展应用场景*：将系统应用到更多场景，如智能客服、教育培训等

如何零基础入门 / 学习AI大模型？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

想正式转到一些新兴的 AI 行业，不仅需要系统的学习AI大模型。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高

那么我作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，希望可以帮助到更多学习大模型的人！至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

👉 福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点 👈

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

read-normal-img

640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉 福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点 👈

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

从零开始搭建 RAG 智能问答系统：一个完整的实战案例｜附源码

如何零基础入门 / 学习AI大模型？

全套AGI大模型学习大纲+路线

640套AI大模型报告合集