李想详解智驾未来:VLA架构能否引领行业破晓?
创始人
2025-05-08 13:12:01
0

早在2024年末,李想在第一季AI Talk上就预言,智能驾驶的基座模型终将进化为VLA。这一观点,在理想汽车于同年10月推出端到端+VLM(视觉语言模型)智驾方案后不久,便显得尤为前瞻。然而,年底时李想又明确表示,理想汽车将全力押注VLA,这一转变或许让部分用户感到困惑,毕竟端到端+VLM方案尚处推广初期。

进入2025年,理想AI Talk第二季上,李想进一步阐述了为何选择VLA作为现阶段的最强架构。他指出,VLM在处理复杂场景时,如京承高速等拥有众多ETC出入口的路段,其位置判断能力显得力不从心。VLM的架构缺陷,使得单纯增加语料数据无法从根本上解决问题。相比之下,VLA通过结合视觉、语言及行动数据,展现出更接近甚至超越人类驾驶能力的潜力。

为了构建VLA,理想汽车采取了三步走的策略:首先是VL(视觉语言)基座预训练,这一步相当于人类通过学习视觉、语言及二者联合数据来认知世界;其次是辅助驾驶后训练,类似于人类在驾校学习驾驶,通过实际操作数据训练出VLA司机大模型;最后是强化学习,通过日常驾驶中的反馈,进一步优化VLA对交通规则的理解及符合用户驾驶习惯的能力。

理想汽车的VLA方案,最终以司机Agent的形式呈现,能够理解人类自然语言指令,实现用户意图与车辆动作的精准匹配。在测试中,司机Agent能够根据语音指令在不退出NOA(导航辅助驾驶)的情况下切换路线,或在高速出入口选择人工通道,展现了极高的灵活性和智能性。

面对VLA方案仍存在的黑盒问题,理想汽车采取了积极措施。他们组建了超过1000人的超级对齐团队,并构建了仿真世界模型,以在虚拟环境中验证司机Agent的专业性、职业性和信任构建能力。这一举措不仅大大降低了验证成本,还提高了测试效率。

针对英伟达Orin-X芯片无法直接运行语言模型的挑战,理想汽车凭借自研的底层推理引擎和INT4量化技术,成功实现了VLM在芯片上的运行。这一技术创新,彰显了理想汽车在智能驾驶技术领域的深厚底蕴和原创能力。

对于近期辅助驾驶车型事故频发、消费者信任度下降的现象,理想汽车持乐观态度。他们认为,这只是技术发展过程中的暂时挫折,不会阻碍技术的进步。理想汽车将继续秉持谨慎态度,加强验证频次,确保技术的安全性和可靠性。

作为国内辅助驾驶技术的领军者,理想汽车正通过VLA方案,为整个行业带来新的启示和思考。未来,随着技术的不断演进和完善,智能驾驶技术将更加成熟、可靠,为人们的出行带来更多便利和安全。

相关内容

热门资讯

全合成机油0w和5w哪个好 全... 全合成机油0W和5W的选择,关键在于理解它们在冬季流动性上的差异。W代表Winter,即冬季,而数字...
审车没带灭火器怎么办 审车没带... 车辆年检时是否需要灭火器?车辆年检时需要灭火器。在进行车辆年检时,除了需要准备好驾驶证、身份证、处理...
四个交通标志 四个交通标志 四... 为了规范车主的行为并维持道路秩序,道路标线和指示牌被制定出来。这些标志可以帮助车主在行驶时直观地认识...
真我gt5价格 真我gt5价格... 真我GT5价格真我GT5价格在即将步入的8月份,我们会迎来不少新机发布,这些手机大多都是主打高性价比...
天籁耐用还是雅阁耐用 天籁耐用... 在探讨天籁与雅阁的耐用性时,我们首先要明确,耐用性并非单一因素所能决定,而是涉及车辆设计、材质选择、...
哈弗h5为啥油耗那么高 哈弗h... 哈弗H5油耗高的原因有很多,只有找到问题的根源,才能提出有效的解决方案。以下是几个常见的原因和解决方...
c919是什么车 c919是什... 什么是C919?C919是中国自主研制的一款大型客机,它按照国际民航规章自行研制,具有完全自主知识产...
机动车强制报废标准规定 机动车... 一、汽车的报废标准 1、(1)家用5座位轿车以及7座位的SUV,非营运的小、微型汽车无使用年限。在正...
哈啰顺风车如何备注不承担高速费... 对于哈啰顺风车乘客不承担高速费的情况,可以在备注信息写清楚。因为哈啰顺风车的默认价格通常是不包含高速...
h4led灯泡正确安装方法 h... 正确安装H4 LED大灯的方法如今,H4 LED大灯的左右方向安装更加流行。作为一种按照一定标准生产...