大模型里常说的AI智能体（Agent）是什么？

kuokay

于 2025-03-25 06:30:00 发布

阅读量1k

点赞数 11

CC 4.0 BY-SA版权

文章标签：人工智能 agent 代理智能体 dify autogen

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45066628/article/details/146362402

在这里插入图片描述

从图灵的“会思考的机器”到今天的Agent，其本质是人类试图在数字世界复刻自身的认知架构——感知、思考、行动、进化的循环。正如《西部世界》中AI觉醒的隐喻：当Agent开始主动追问“我的目标是否合理”时，真正的智能革命将拉开帷幕。

在这里插入图片描述

为什么需要Agent

一、LLMs 的局限与 Agent 的诞生

传统大语言模型（如 GPT-4）虽然具备强大的语言理解和生成能力，但存在以下关键限制，直接催生了 Agent 的需求：
1. LLMs 的核心局限

被动响应
LLMs 只能根据输入提示（Prompt）生成文本，无法主动拆解复杂任务。
例如：用户提问“如何开发一个天气预报 App？”时，传统 LLM 会输出步骤说明，但无法自动调用代码编辑器、API 调试工具或部署服务器。
缺乏长期记忆
LLMs 的对话是“无状态”的，每次交互独立处理，无法积累经验或用户偏好。
例如：用户多次要求“推荐适合徒步的景点”，LLM 不会记住用户曾偏好山地而非沙漠环境。
无法与环境交互
LLMs 是封闭的文本生成系统，无法调用外部工具（如搜索引擎、数据库、机器人硬件）。
例如：用户要求“分析某公司股票走势”，LLM 无法实时获取金融市场数据。
单次推理局限
LLMs 的回答基于单次推理，缺乏多轮验证和动态调整能力。
例如：解决数学题时，若首次推理错误，LLM 难以自我修正。

2. Agent 如何突破这些限制
通过为 LLMs 添加 “感知-规划-行动”循环架构，Agent 实现了质的跃升：

主动规划
将用户目标分解为任务链（如“开发 App” → 需求分析→UI设计→API调用→测试部署）。
记忆系统
短期记忆（对话上下文） + 长期记忆（向量数据库记录用户历史偏好）。
工具调用
整合代码解释器、网络搜索、专业软件（如 MATLAB）等外部能力。
反思优化
通过 ReAct 框架（Reasoning + Action）动态验证结果并修正错误。

二、从 CoT 到 Agent：从“纸上谈兵”到“实战推演”

链式思考（Chain-of-Thought, CoT）通过显式展示推理步骤提升了 LLMs 的复杂问题解决能力，但 Agent 进一步将其升级为 “思考+行动”的动态闭环。

一个完整的CoT形式的Prompt通常由三部分组成：指令（Instruction）、逻辑依据（Rationale）和示例（Exemplars）。

为什么使用CoT

提升了大模型的推理能力：通过将复杂问题拆解为简单的子问题，CoT大大增强了模型的推理能力。
提高了模型的可解释性：与单纯输出结果的模型相比，CoT可以展示模型的解题过程，帮助我们更好地理解模型是如何工作的。
增强了模型的可控性：CoT让模型一步步展示解题步骤，我们通过观察这些步骤可以更大程度地影响模型的问题解决过程，避免模型成为无法控制的“完全黑盒”。
提升了模型的灵活性：只需添加一句“Let’s think step by step”，CoT方法便可在各种大型模型中使用。

CoT 的局限

静态推理：CoT 的思考过程仅停留在文本层面，无法与环境交互验证。
例如：用 CoT 解数学题时，若某步计算错误，LLM 无法通过实际运算发现并纠正。
单次输出：生成完整推理链后即结束，缺乏迭代优化机制。
无工具集成：依赖纯文本推理，无法调用计算器、编程工具等。

总结：Agent 的诞生并非替代 LLMs，而是通过 “大脑（LLM）+ 手脚（工具）+ 记忆（数据库）” 的架构，将语言

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

kuokay 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。