0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶中Transformer大模型会取代深度学习吗?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-08-13 09:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被持续讨论。特别是在自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与实际落地路径等维度来看,Transformer与深度学习并非你死我活的替代关系,更像是相互协作的搭档,各自承担着不同但关键的系统职责。

在自动驾驶的系统架构中,感知、预测、决策和控制构成了整套智能系统的核心流程。感知主要依赖传感器获取包括车辆、行人、车道、红绿灯等外界信息,而后续的模块将这些信息输入到路径预测、行为推理、避障规划等过程中,最终通过控制模块发出操作指令。传统的深度学习技术,尤其是卷积神经网络(CNN)、循环神经网络(RNN)以及长短期记忆网络(LSTM),在这些任务中长期占据主导地位。它们擅长从大规模标注数据中学习复杂模式,尤其在图像识别和语义分割任务中表现极其稳定。这些能力对于自动驾驶感知模块来说至关重要,因为车辆必须在毫秒级时间内精确识别交通元素,做出正确判断。

那么,Transformer及其演化版本——大语言模型(LLMs)是如何进入自动驾驶语境的?最早,这类模型在自然语言处理(NLP)中大放异彩,其核心能力是利用“注意力机制”捕捉序列中各个元素之间的全局关系,从而建立强大的上下文理解能力。当这种能力扩展到图像、视频、雷达点云等非语言模态时,便演化出了多模态大模型。这些模型开始被用于分析交通情境、预测行为意图甚至制定高层级的驾驶策略。如当系统识别到一名行人正在接近斑马线时,LLM可以结合先前的上下文,推理出行人可能即将穿越道路,从而提示系统减速或者绕行。

尽管LLM拥有非常强的表现,但想让LLM完全替代传统深度学习仍存在很多障碍。其一,感知模块需要实时响应,对延迟极为敏感,而当前的LLM通常体积庞大,推理延迟高,难以满足车载算力环境下的效率需求。其二,LLM存在“幻觉”问题,即在缺乏明确指令或训练边界时可能生成虚假或无效内容。这在文本生成中也许只是语义错误,但在自动驾驶中则可能导致不可控的安全风险。其三,Transformer架构天生是“黑盒”模型,其推理过程难以解释,这与自动驾驶系统对安全审计、责任划分和法规合规的高度可解释性要求存在本质冲突。

当前一些技术方案正在尝试“融合式架构”,即不再二选一,而是将Transformer与深度学习各自用于最适合的模块中。如感知系统继续由CNN主导,以保证高效率和高准确性,而行为预测、意图理解等推理性任务则由LLM辅助,提供更加丰富的语义支撑。甚至出现了一些具有“世界模型”能力的Transformer,可以通过对复杂交通环境的抽象建模,实现自我模拟、自我优化。如小马智行和Waymo等企业就采用了生成式AI与强化学习相结合的路径,用于训练自动驾驶系统在“长尾场景”中的鲁棒性。

wKgZPGib50-AEv3KAABtyQxab3s872.jpg

小马智行解决方案

所谓“长尾场景”,是指那些在现实中极其罕见但又可能导致严重事故的交通情形,比如高速公路上掉落的铁桶,或电动车突然逆行。这类场景在真实数据集中几乎不可能穷尽采集,因此生成式AI成为补充训练数据的有效手段。Transformer在此处可以发挥作用,通过构建基础世界模型,模拟出这些罕见事件,从而提升系统的泛化能力。这种方式与AlphaGo早期学习人类棋谱的模仿学习相比,更类似于AlphaZero的自我博弈训练逻辑,即通过模拟世界不断优化自身策略。

模拟能力的提升也不意味着真实感知能力可以被忽略。真实环境下的道路情况千变万化,光线、天气、交通设施甚至人类行为都有不可预测的变量。只有深度学习算法对真实传感器数据的稳定识别能力,才能确保系统在最底层建立可靠输入。Transformer只能在此基础上做进一步“思考”,却不能完全“接管”任务流程。

还有一个不能忽视的问题是资源成本。LLMs往往依赖如GPU、TPU或专用神经网络加速芯片等高性能算力平台,其部署成本极高。尤其在边缘计算为主的自动驾驶车辆中,车载芯片资源有限,无法支持大规模参数模型的常态运行。相比之下,传统深度学习模型经过多年优化,早已形成标准化的轻量级版本,能够在嵌入式平台上高效运行。因此,目前主流厂商多数仍在感知和控制层面采用深度学习方案,而将Transformer用于云端或训练环节,作为仿真生成、行为推理等场景的工具。

在路径规划环节,Transformer也遇到实际挑战。路径规划是一项要求高度实时性和高可靠性的任务,每一次决策都必须在极短时间内完成,并具备高度确定性。大模型虽然在策略生成和规则制定上具备潜力,但在执行效率和可控性方面仍难与传统A*、RRT、BEV-basedlearning等路径规划算法媲美。此外,大模型输出的随机性与路径规划任务的确定性形成天然冲突,一旦规划路径不确定或出现偏差,将严重影响行车安全。

从系统架构的演进趋势来看,自动驾驶行业正逐步走向“多模态+分工协作”模式。感知、控制、导航等模块保持使用稳定可靠的深度学习体系,而认知层、交互层则可逐步引入LLMs,提升整车系统的理解力和推理能力。如自动驾驶车辆在接近施工区域时,传统模型只能识别出前方有障碍物,而LLMs能够通过“语义理解”判断出这些障碍可能是临时的,进而优化绕行路径。未来还可探索将自然语言与车辆交互融合,如让乘客以语音方式发出“去最近的加油站”或“我想避开高速”之类指令,由大模型解析后生成交通行为策略。

但这些探索尚处于试验与验证阶段。监管机构对自动驾驶系统的“黑盒性”极为谨慎。Transformer模型在文本生成中出现的不稳定性一旦迁移至交通系统,可能导致灾难性后果。因此,目前的大模型更可能作为“增强模块”参与系统设计,而非完全替代深度学习基础架构。

从整个行业来看,判断Transformer是否取代深度学习,关键不在于技术路线之争,而在于适用性与安全性。在大语言模型快速发展的背景下,我们应当看到其在认知理解、行为建模与复杂推理上的巨大潜力,但也必须正视其高算力需求、不确定性输出和缺乏可解释性的现实挑战。在自动驾驶这样的“物理AI”场景中,任何一个系统模块的失误都可能带来生命安全风险,因此技术的引入必须谨慎。

简而言之,Transformer与深度学习之间并非此消彼长的替代关系,而是互补与融合的发展格局。它们在不同层级承担各自最擅长的任务,共同构建更加智能、安全与高效的自动驾驶系统。未来,随着技术演进与芯片平台优化,或许会出现更加轻量化、可解释且稳定的Transformer模型,从而进一步拓宽其在自动驾驶系统中的角色,但在此之前,深度学习仍将在底层稳定运行,筑牢智能出行的安全基础。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    790

    文章

    14389

    浏览量

    171395
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123068
  • 大模型
    +关注

    关注

    2

    文章

    3226

    浏览量

    4218
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶真的会来吗?

    所需要的图像识别、计算机视觉、深度学习等关键技术的投资热度在明显增强。另外,也已经有公司在开发不同于普通地图的3D地图,能详细到道路旁边的电线杆的位置,以及与下一个油桶、灯柱距离。对于自动驾驶的发展
    发表于 07-21 09:00

    细说关于自动驾驶那些事儿

    辅助系统系统)用到的技术重迭。自驾车如何看见世界为什么要这么多种传感器?优缺点互补目前多数车商在量产车配备的“自动驾驶”功能,包含特斯拉、Volvo、Mercedes-Benz、奥迪等,事实上就是搭载
    发表于 05-15 17:49

    自动驾驶的到来

    的Telematics收发芯片,非常适合V2V及V2X等相关应用。  相比于传统的底盘、发动机等传统汽车技术,自动驾驶更多的技术集中在电子领域,而且核心技术并没有被跨国车厂或Tier1所垄断。并且
    发表于 06-08 15:25

    AI/自动驾驶领域的巅峰会议—国际AI自动驾驶高峰论坛

    已经渗透到了社会生活的方方面面。人工智能在自动驾驶领域将对整个汽车出行领域产生颠覆性变革。汽车的人工智能技术和数据后端的最新突破使自动驾驶成为可能。深度学习、高级数字助理和动态电子视野
    发表于 09-13 13:59

    如何让自动驾驶更加安全?

    自动驾驶、完全自动驾驶。第四级别是汽车驾驶自动化、智能化程度最高级别,也就是通常所说的无人驾驶。现实
    发表于 05-13 00:26

    如何保证自动驾驶的安全?

    自动驾驶技术为人们勾勒出了一副美好的未来出行的画面:坐上没有方向盘的汽车,一觉睡到公司门口;甚至我们可能不再拥有一辆汽车,需要出门时共享自动驾驶汽车自己到来,送到目的地时会自行离开……不过
    发表于 10-22 07:45

    自动驾驶车辆AI面临的挑战

    自动驾驶车辆采用的AI算法自动驾驶车辆AI面临的挑战
    发表于 02-22 06:39

    探讨深度学习自动驾驶的应用

    深度强化学习的理论、自动驾驶技术的现状以及问题、深度强化学习自动驾驶技术当中的应用及基于
    的头像 发表于 08-18 10:19 5522次阅读

    如何基于深度神经网络设计一个端到端的自动驾驶模型

    如何基于深度神经网络设计一个端到端的自动驾驶模型?如何设计一个基于增强学习自动驾驶决策系统?
    的头像 发表于 04-29 16:44 5385次阅读
    如何基于<b class='flag-5'>深度</b>神经网络设计一个端到端的<b class='flag-5'>自动驾驶</b><b class='flag-5'>模型</b>?

    深度学习技术与自动驾驶设计的结合

    在过去的十年里,自动驾驶汽车技术取得了越来越快的进步,主要得益于深度学习和人工智能领域的进步。作者就自动驾驶中使用的深度
    发表于 10-28 16:07 2248次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>技术与<b class='flag-5'>自动驾驶</b>设计的结合

    深度学习算法在自动驾驶规控的应用解读

    虽然目前公开的自动驾驶规控算法相关资料大都是针对基于规则的算法的,但笔者打开招聘软件却经常能看到自动驾驶企业招聘规控算法工程师时会要求候选人懂深度学习算法,这在某种程度上也说明了目前很
    的头像 发表于 11-16 09:57 1700次阅读

    自动驾驶的机器学习

    近年来,自动驾驶技术技术的发展速度非常快。预计达到完全自动驾驶L5的程度是指日可待的。自动驾驶的核心技术主要是人工智能的机器学习与深 度
    发表于 06-06 10:06 0次下载
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中</b>的机器<b class='flag-5'>学习</b>

    深度学习自动驾驶的关键技术

    随着人工智能技术的飞速发展,自动驾驶技术作为其中的重要分支,正逐渐走向成熟。在自动驾驶系统深度学习技术发挥着至关重要的作用。它通过模拟人
    的头像 发表于 07-01 11:40 1381次阅读

    自动驾驶中一直说的BEV+Transformer到底是个啥?

    在很多车企的自动驾驶介绍,都会听到一个关键技术,那就是BEV+Transformer,那BEV+Transformer到底是个啥?为什么很多车企在
    的头像 发表于 11-07 11:19 1511次阅读
    <b class='flag-5'>自动驾驶</b>中一直说的BEV+<b class='flag-5'>Transformer</b>到底是个啥?

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    近年来,人工智能技术迅速发展,大规模深度学习模型(即大模型)在自然语言处理、计算机视觉、语音识别以及自动驾驶等多个领域取得了突破性进展。
    的头像 发表于 03-28 09:16 459次阅读