COT存在的问题以及ReAct Agent对此所做的优化

最新推荐文章于 2025-07-22 17:59:31 发布

ybdesire

最新推荐文章于 2025-07-22 17:59:31 发布

阅读量541

点赞数 10

CC 4.0 BY-SA版权

分类专栏：大语言模型 Agent智能体文章标签：人工智能语言模型深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ybdesire/article/details/142914816

大语言模型同时被 2 个专栏收录

34 篇文章

订阅专栏

1 篇文章

订阅专栏

从ReAct的论文中（参考1），可以看到，单纯用COT，也会存在一些问题，靠COT也无法很好的回答问题，如下图所示：

在这里插入图片描述
从图中可见，虽然COT能给出推理过程，但最终结论也是错误的。

原因如下：

LLM本身不可能知道所有知识；
COT是黑盒的，因为模型使用自己的内部表征来产生思想，而不以外部世界为基础，这限制了它的反应性推理或更新知识的能力；
需要多个假设或大量的来回交流互动，这种方式会消耗大量计算资源。

这可能导致诸如事实幻觉和推理过程中的错误传播等问题。所以作者测评后，给出的结论是“Hallucination is a serious problem for CoT”。

作者提出ReAct框架，来解决这些问题，ReAct的核心构成部分如下：

思维链（Chain of Thought）：此组件负责将一个庞大且复杂的任务细分为多个逻辑上的思维步骤；
推理（Reasoning）：该组件专注于对输入的数据进行深入分析并处理，从而制定出有效的决策方案；
行动（Action）：此组件承担执行具体任务的角色，如进行搜索、运行代码或执行其他自定义的操作；
观察（Observation）：该组件负责监控环境的变化并收集反馈数据，为后续的推理和行动提供必要的依据和参考。

参考

https://arxiv.org/pdf/2210.03629

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。