”汽车与汽车零部件行业智驾平权系列六:AI智能涌现新阶段,智驾VLA与世界模型之争”由长江证券发布。
“幻影视界”整理分享报告摘要如下
AI 赋能,智驾进入大模型时代
通用人工智能大模型迎来跨越式发展,模型规模、训练范式与推理能力持续突破,为各类 AI 应用构建了坚实的底层技术底座。智能驾驶本质是“物理 AI”的应用,大模型底座技术迭代加 速智驾驾驶持续升级。通用大模型能力涌现,赋能智驾模型基座,智驾模型架构持续进阶,逐 步进入 VLA 和世界模型的物理AI 时代,迈向智能涌现新阶段。
通用大模型能力“涌现”,铸就 AI 应用底层支撑
AI 大模型时代,以 Transformer 架构为技术基底,依托算力的指数级提升与海量多模态数据的积累,大模型实现了从单一语言理解到多模态融合、从专用任务适配到通用能力涌现的关键突破,铸就AI 应用底层支撑。重要节点来自于AI 模型开发开始强调提升推理(Reasoning),以o1-preview 为代表,模型推理能力飞跃,引入Agent 模式,实现功能体验的质变。同时,DeepSeek-R1 模型基于纯强化学习的创新技术路径展现出独特优势,提升模型训练效率和降低训练成本,使模型规模扩展的 "规模定律(Scaling laws)" 持续显现,满足国内算力不充裕背景下对于超大参数智驾模型训练的需求。
智驾大模型进阶,迈向智能涌现新阶段
自动驾驶经历从规则模型走向端到端大模型,并逐步向VLA 和世界模型演进。传统端到端模型核心是通过神经网络直接建立视觉输入到驾驶轨迹输出的映射关系,“黑盒”方式缺乏对于 物理世界运行规律的深入理解,过程中无需显式的语义理解或逻辑推理。随着多模态大模型和 强化学习训练模式的引入,智驾“端到端”模型向 VLA 范式演进,提升深度推理与决策的能力,逐步具备长思维链(CoT)能力,进一步提升泛化能力和增强模型动作的可解释性。在模型训练方面,借鉴DeepSeek 训练方式优点,强化学习逐步引入智驾领域,借助多阶段强化学习训练机制,提升模型训练效率和降低训练成本。同时通过与世界模型生成的仿真环境进行互动,可以使模型对真实世界的物理规则拥有更深的理解,智驾进入物理AI 时代。国内头部玩家智驾模型加速迭代,向VLA 和世界模型持续推进,模型架构、训练方式、算力、数据以及参数量升级,头部智驾玩家最新方案预期陆续推送,智驾能力有望迎来飞跃。目前头部智驾玩家中,以小鹏、理想等为代表的主机厂主要采用VLA 模型路线,以华为、蔚来等为代表的主机厂主要采用世界模型路线。
幻影视界整理分享报告原文节选如下:
本文仅供参考,不代表我们的任何投资建议。幻影视界整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。