新型多模态AI框架为自动驾驶汽车带来类人推理能力
创始人
2026-01-10 00:25:44
0

猿力部落——汽车人的技术社区

据EurekAlert! AAAS报道,自动驾驶技术发展迅猛,已从基于规则的系统过渡到深度神经网络。然而,端到端模型仍面临诸多缺陷:它们往往缺乏世界知识,难以应对罕见或模糊的场景,并且对其决策过程的洞察也十分有限。相比之下,大型语言模型(LLM)在推理、情境理解和解读复杂指令方面表现出色。然而,LLM的输出是语言性的而非可执行的,这使得它们难以与实际车辆控制系统集成。这些差距凸显了构建框架的必要性,该框架应将多模态感知与基于成熟驾驶逻辑的结构化、可操作的决策输出相结合。应对这些挑战需要对如何将多模态推理与自动驾驶规划器相融合进行更深入的研究。

上海交通大学、上海人工智能实验室、清华大学及合作机构的研究团队开发了DriveMLM,这是一个用于闭环自动驾驶的多模态大型语言模型框架。该研究成果发表在《视觉智能》(Visual Intelligence)期刊上。DriveMLM整合了多视角摄像头图像、激光雷达点云、系统消息和用户指令,生成对齐的行为规划状态。这些状态可以直接接入现有的运动规划模块,从而实现实时驾驶控制,并为每个决策生成自然语言解释。

DriveMLM解决了基于LLM的驾驶中的一个核心挑战:将语言推理转化为可靠的控制行为。该框架将LLM的输出与模块化系统(例如Apollo)中使用的行为规划状态相匹配,涵盖速度决策(保持、加速、减速、停止)和路径决策(跟随、左转、右转等)。

一种专门的多模态分词器将多视角时序图像、激光雷达数据、交通规则和用户指令处理成统一的词嵌入。然后,多模态逻辑学习模型预测合适的决策状态并生成相应的解释,从而确保可解释性。

为了支持训练,团队创建了一个大规模数据引擎,该引擎在八张CARLA地图和30个具有挑战性的场景(包括罕见的安全关键事件)上生成了280小时的驾驶数据。该流程会自动标注速度和路径决策,并结合人工修正和基于GPT的数据增强,生成丰富的解释性标注。

在CARLA Town05 Long基准测试的闭环评估中,DriveMLM的驾驶得分达到76.1分,比Apollo基线系统高出4.7分,并且在所有对比系统中实现了最高的每次干预里程数(0.96英里)。DriveMLM还展现出强大的开环决策准确性、更高的解释质量以及在自然语言指导下的稳健性能——例如,在不同的交通状况下,能够避让紧急车辆或理解“超车”等用户指令。

研究团队指出:“我们的研究表明,LLM一旦与结构化决策状态相匹配,就能成为自动驾驶车辆强大的行为规划器。DriveMLM超越了简单的规则遵循。它能够理解复杂的场景,推理运动规律,并用自然语言解释其决策——这些能力对于安全性和公众信任至关重要。DriveMLM将感知、规划和人工指令整合到一个统一的框架中,为下一代自动驾驶系统提供了一个充满希望的发展方向。”

DriveMLM展示了多模态逻辑逻辑模型如何提升自动驾驶的透明度、灵活性和安全性。其即插即用设计使其能够无缝集成到Apollo或Autopilot等现有系统中,无需进行重大架构变更即可改进决策。解读自然语言指令的能力拓展了交互式驾驶辅助和个性化车载AI副驾驶的可能性。更广泛地说,DriveMLM为构建能够理解复杂环境、预测风险并为其行为提供合理依据的推理驱动型自动驾驶系统指明了方向——这些都是在实际交通网络中部署可信赖AI的关键能力。

相关内容

热门资讯

《人民日报》专访魏建军,以“信... 站在2026年“十五五”开局的新起点,中国经济正加速从高速增长向高质量发展全面转型。作为国民经济重要...
通用汽车电池工厂转型,返聘70... IT之家 3 月 18 日消息,继福特将部分原本用于纯电车型的电池工厂转向储能业务后,通用汽车也做出...
奇瑞星途EX7开启盲订:量产首... IT之家 3 月 18 日消息,在今晚的 2026 奇瑞汽车电池之夜上,奇瑞宣布旗下高端品牌星途宣布...
广汽丰田铂智3X上市一周年 ,... 3月18日 ,广汽丰田铂智3X官宣重磅OTA升级 ,重点聚焦用户最关心的智驾、智舱、 安全三个方面。...
奇瑞“犀牛电池”登场,到底有多... 在绿色能源转型与双碳目标深度融合的时代浪潮中,新能源汽车正从电动化启蒙迈入体系化较量的下半场。 3月...
爱P7的鹏友们,小鹏P7新色+... 今日,小鹏「爱 P7 的鹏友大聚会」圆满收官!此次发布会,小鹏P7带来了星曜红、暗夜黑、星云白三款全...
400km/h!特斯拉新车官宣... 如果你是新朋友,请点击上方的蓝色字 关注 “高科技爱好者”,保证不会让你失望的. 今天是2026年3...
原创 难... 行业人士指出2025年进入世界500强的中国汽车企业实现147亿美元利润,而电池一哥就取得了71亿美...
网约车监管信息交互系统发布20... 据网约车监管信息交互系统监测,截至2026年2月28日,全国共有396家网约车平台公司取得网约车平台...