引
今年,会是很不一样的一年,AI 和 Agent 会让我们做事的方式彻底改变。
先来看一段视频,这是前天我让新来的 AI 实习生做的一份报告:
,时长00:18
其实我只是让他去看看用户评价的,没想到他这么努力地整了一份报告,这就是传说中喜欢超出预期的卷王员工吗?
这两天跟 AI 实习生打交道的过程,让我感慨良多,AI 越来越强,凡事就应该让 AI 和 Agent 先上。
3月初,Manus 发布,让 AI Agent 概念普及,400万人在排队等待体验 Agent。
3月底,AutoGLM 沉思发布,让 AI Agent 免费可用,大家都不用排队了。
人人都可以直接上手体验 Agent,感受 Agent 带来的新奇体验。
AutoGLM 沉思是什么?
AutoGLM 沉思是智谱的 AI Agent 产品,能够让机器像人一样思考和行动,一边想,一边干。
它可以做三件事:
- \1. 使用大模型模拟人的大脑,规划、思考、反思
- \2. 使用本地浏览器模拟人的行动,看知乎、看京东、看小红书
- \3. 行动之后,感知世界,根据反馈,继续下一次思考和行动
沉思而后行,直到完成任务。
通俗的解释:
AutoGLM沉思是你电脑上的免费实习生。
你只需要下达指令,放到后台。
它会自己用浏览器上网,完成任务。
差异性的解释:
Manus 是一个远程电脑上的 Agent,使用多种工具,无须本地资源,价格高昂。
AutoGLM 是你本地电脑的 Agent,主要使用浏览器,占用本地资源,价格免费。
我让 4o 帮大家做了一份图文笔记:
AutoGLM 沉思的深度体验
我使用 AutoGLM 沉思实测了六个任务,它很好地完成了四个任务,但有两个任务无法完成。
让我们一起看看是为什么。
任务一:在京东找到销量前十的人体工学椅,并整理已购买用户对十把椅子的评价
这是我们平时经常需要用到的购物对比场景,如果是人来做的话,找商品,翻评论,也要花不少时间。
这个任务考验 Agent 的动手能力,要求 Agent 通过浏览器访问京东,找到销量最高的椅子并分别收集下面的评论,单纯通过网络搜索是无法做到的。
AutoGLM 沉思先打开了京东,让我帮它登录了一下,搜索人体工学椅,并找到了销量最高的10款椅子。
然后,它开始逐一访问这些产品的详情页,并开始收集用户评价。
在收集完成所有信息之后,它决定写一份报告,列出每一把椅子的详细信息,最终完成了一份5000字的报告。
它按需求列出了10把椅子的详细信息:
除此之外,它还识别到了这个任务的真实意图,是在一定预算内挑选适合自己的椅子。
所以它自己总结了不同价格区间的推荐选择,并提供了选购人体工学椅的要求和建议。
(点击查看大图)
最后,AutoGLM 根据收集来的所有信息,最终推荐了4把椅子,其中高端的那款,朋友刚好买了用了两年,我问他怎么样,他说强烈推荐购买。
整个任务完成得非常好,完整的报告和结论可以在这里查看:
https://chatglm.cn/share/FQvD0
为了给大家演示,我让另一个审美最好的37号 AI 实习生做了一个可视化版本,就是你在文章开头看到的那个视频:
,时长00:18
另外,这个任务我也用 Manus 跑了一次,但很可惜,在花光价值10美金的1000点数之后,超出了上下文限制,任务失败。
任务二:调研中国人最需要补充的5种维生素有哪些,详细描述它们的作用、背后的科学研究、作用于人体的原理、普通人补充维生素的方法和建议
这是我们平时经常遇到的生活类知识问题,我们会看到各种人种草各种营养补剂,但问题是我们真的需要吗?我们需要从数据上、原理上去分析,才能得出结论。
这个任务要求 Agent 思考如何定义「最需要补充」,并从各种报告中抽丝剥茧,汇总成我所需要的信息。
Agent 在找了一轮信息之后,发现了一个关键问题:维生素低于推荐摄入量,也许只是摄入量不太够,并不意味着缺乏。
中间带着思考,Agent 排除了维生素E和维生素K。
最后,Agent 综合所有信息,给出了一份6000字的报告。
完整的报告在这里:
https://chatglm.cn/share/FQvCD
任务三:我是一名产品经理,正在学习 Vibe Coding,请你设计一个详细的教程,从产品方向选择,工具选择、具体流程、注意事项等几方面详细指导我进行学习
当我们遇到一些新概念新事物时,我们想对新事物有一个全局的了解,并且希望得到一些入门引导,这时候让 Agent 做一个总览的调研就非常合适。
Agent 先去搜索了 Vibe Coding 是什么,然后开始收集其他的相关信息。
在收集了很多信息之后,发现了我个性化的需求,就是产品经理使用 Vibe Coding 的最佳实践。
最终形成了一份5000多字的报告,包含定义、价值、产品方向、工具选择与比较等等。
(点击查看大图)
Vibe Coding 的完整报告:
https://chatglm.cn/share/FQvPY
任务四:我需要一份 4 月 15-23 日从上海出发的 7 天日本行程,预算为 1-3 万元,适合我和未婚妻。我们喜欢名胜古迹、隐藏的宝藏和日本文化(剑道、茶道、禅宗冥想)。我们想看看奈良的鹿,步行探索城市。我计划在这次旅行中求婚,需要一个特别的地点推荐。请提供一份详细的旅行手册,其中包含地图、景点介绍、必要的日语短语和旅行小贴士,供我们在旅途中参考。
这个任务是 Manus 的示例任务,通过非常详细的指示,让 Agent 完成高度定制化的旅行方案规划,这样的规划在以往都需要专业的旅行规划师才能完成。
报告很长,具体就不放了,直接截取一部分结果:
AutoGLM 的完整报告在这里
https://chatglm.cn/share/FQvk2
Manus 的在这里,可以作为对比
https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1
任务五:找到今天的小红书热点,然后调研每个热点在讲什么,生成一份详尽的信息汇总
这个任务其实是运营同学们很刚需的场景,如果有这类报告,那每天都会很方便。
虽然 AutoGLM 沉思知道可以通过小红书的搜索找到热榜,但它打开小红书之后,但没找到小红书的热榜。
它尝试去第三方的新红寻找,但是那边的信息需要付费。
如果这里我付费的话,它确实是可以找到的,但是我没付费,就成了它的卡点。
任务六:我在北京,下周要去一趟日本,请在携程上帮我看看哪天的直飞机票比较便宜
这个任务我以为会非常简单,毕竟只需要打开携程,查一下。
AutoGLM 沉思先去了携程,遭遇了一系列的404
然后它又尝试去其他网站搜索,但最终实际的结果是这样的
可能是因为这些网站都需要登录,并且需要 Agent 能非常精确地填写表格信息才可以。
总体来说是个目前对 Agent 来说比较难的任务,也让我们思考,网站在设计的时候是不是应该对 Agent 更简单友好一些?
以上六个任务测完,四个成功,两个失败。
我的总体感受是,Agent 可以帮我完成一半的任务,虽然我不知道是哪一半。
一个好的策略是,不管什么任务,都先让 Agent 去做一遍,它不行,我再上。
这样就能节省 50% 的时间。
AutoGLM 沉思的使用流程
- \1. 下载智谱清言客户端,链接:https://chatglm.cn/
- \2. 安装智谱清言的 Chrome 插件,让它能控制浏览器 https://new-front.chatglm.cn/webagent/landing/index.html?channel=chatglm
- \3. 打开智谱清言客户端,输入你的任务
- \4. 它会自动打开浏览器开始任务,但有时候需要你需要帮它登录网站
- \5. 最小化到后台,让它自己运行,不干扰你使用电脑
AutoGLM 沉思背后的技术
AutoGLM 沉思的技术架构包括:
- 智能体框架
- 设备操控 AutoGLM
- 沉思模型 Z1-Rumination
- 推理模型 Z1-Air
- 基座模型 GLM-4-Air0414
这几个模型的关系是这样的:
推理模型 GLM-Z1-Air,基于基座 GLM-4-Air0414 进行训练,特别提升了代码编写、工具调用等智能体任务的相关能力。效果比肩 DeepSeek R1,速度提升 8 倍,价格只有 30 分之一。
在 GLM-Z1-Air 的基础上,又通过强化学习训练,提升了模型结合工具使用完成长程推理能力,最终得到了沉思模型 GLM-Z1-Rumination。
根据智谱官方的信息,AutoGLM 沉思以上所有 Agentic 模型和技术将在4月14日全部正式开源,回馈技术社区。
1月的时候,我对 DeepSeek 的总结是:中国开源,震撼世界。
4月的时候,智谱将再次通过开源,给世界带来一次新的震撼。
AutoGLM 沉思当下技术的瑕疵
AutoGLM 沉思是第一款免费可用的本地 Agent。
成为第一个,往往伴随很多的瑕疵:
- 速度有点慢,思考有时会出错,上网的时候也会遇到各种各样现实的网络问题。
- 稳定性还不够,偶尔会触发卡死,对电脑的性能要求高。
- 一次只能跑一个任务,不能并发,耗时较长
另外,AutoGLM 沉思还继承了人类打开新tab不关的坏习惯,跑完一个任务之后,你的浏览器会变成这样,成为内存杀手,记得重启一下浏览器再跑下一个任务。
但以上这些都没什么大不了,永远记住好朋友汗青的那句话:
关注未来趋势,不要在意瑕疵。
做好心理准备,然后 Have Fun!
结语
体验 AutoGLM 沉思的过程,非常激动。
因为我知道,就像 DeepSeek R1 是大部分读者对深度思考的第一次体验。
AutoGLM 沉思将是大部分读者的第一次 Agent 体验。
那种感受非常奇妙,请一定要试一试。
在接下来的一两年,AI 和 Agent 将彻底改变我们使用工具的方式。
我把这种新的方式总结为:
AI First
当我们做任何事情的时候,都应该先让 AI 上,AI 不行我再上。
通过这种方式,我们所获得的,绝不仅仅是节省大量的时间。
随着 AI 的能力越来越强,AI First 带来的收益也会越来越大。
我们将在不知不觉中,超出自己能力的边界。
我们将不断获得惊喜感。
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)
👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈