自动驾驶大模型终极之战:世界模型能否笑到最后?
创始人
2024-11-19 00:32:13
0

【ITBEAR】在自动驾驶技术的浩瀚星空中,一条名为“端到端+大模型”的轨迹似乎正逐渐清晰,成为众多行业巨擘心中的终极方向。

然而,正如自动驾驶技术的多样性与复杂性,大模型的构建亦无固定模板可循。技术的海洋总是波澜壮阔,随着时光的流逝与新技术的涌现,自动驾驶技术也在不断进化,展现出千姿百态的面貌。

自2022年末ChatGPT横空出世以来,生成式AI大模型逐渐分化为两大流派:语言模型与世界模型。语言模型在数字世界深耕细作,从单一文本模态拓展至包含图片、视频的多模态,实现了文生图、看图说话、图生图、文生视频等能力,Sora与GPT4-o便是其中的佼佼者。而世界模型则跨越数字与物理的界限,从一维的数字智能迈向三维的空间智能。

李飞飞,这位出生于北京、在美国成就辉煌的AI先驱,对空间智能有着独到的见解。她认为,空间智能意味着AI能在三维空间与时间中以三维方式感知、推理并行动,与现实世界进行交互。相较于大语言模型以文本序列对世界进行一维表示,空间智能将三维视为表达的核心。

从自动驾驶大模型的赛道来看,小鹏与理想的选择更偏向于在文本基础上叠加图片和视频模态的语言模型,而蔚来与特斯拉则倾向于空间智能的世界模型。语言模型如东北大哥,先声夺人,再决定行动;世界模型则如湖南老表,干脆利落,直接给出行驶轨迹。

在自动驾驶技术的激烈竞争中,数据标注成为关键一环。然而,随着端到端范式的到来,许多数据需要重新标注。语言模型依赖于海量的有监督学习数据标注,而世界模型则通过无监督学习,无需数据标注,便能应对海量数据的新范式。蔚来汽车的世界模型通过推演万千平行世界,选择最优行驶轨迹,这一能力不仅直接给出行驶结果,更通过无监督学习训练出对驾驶场景的深度理解能力,实现了从感知到认知的跃升。

相较于传统的BEV+OCC感知能力,世界模型展现出更加细腻的场景理解能力。它能够理解当前的光照条件、天气情况,这些对自动驾驶至关重要的因素。通过海量数据的无监督训练,世界模型建立了对当前世界的深度理解能力,为准确推演未来世界奠定了坚实基础。

在这场自动驾驶技术的革命中,算力成为制约发展的关键。蔚来选择世界模型,或许正是基于其对算力的更高要求。而随着算力的不断升级,理想和小鹏从语言模型向世界模型的过渡,似乎已成为一个可期的未来。

相关内容

热门资讯

玩家最新攻略“甘孜娱乐中心辅助... 家人们!今天小编来为大家解答甘孜娱乐中心透视挂怎么安装这个问题咨询软件客服徽5848499的挂在哪里...
终于知道“功夫川麻到底是不是挂... 您好,功夫川麻这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,...
终于懂了“飞驰娱乐怎么装挂”!... 终于懂了“飞驰娱乐怎么装挂”!原来真的有挂网上科普关于“飞驰娱乐有没有挂”话题很是火热,小编也是针对...
我来教教您“大玩家十三水可以开... 您好:大玩家十三水这款游戏可以开挂,确实是有挂的,需要了解加客服微信【5848499】很多玩家在这款...
玩家攻略科普“益乐绍兴麻将开挂... 有 亲,根据资深记者爆料益乐绍兴麻将是可以开挂的,确实有挂(咨询软件无需...
终于懂了“花花武汉麻将开挂神器... 无需打开直接搜索微信;【4282891】操作使用教程:1.亲,实际上花花武汉麻将是可以开挂的,确实有...
今日重大发现“心悦麻将到底是不... 有 亲,根据资深记者爆料心悦麻将是可以开挂的,确实有挂(咨询软件无需打开...
今日重磅消息“笑傲江湖有没有挂... 家人们!今天小编来为大家解答笑傲江湖透视挂怎么安装这个问题咨询软件客服徽9752949的挂在哪里买很...
独家分享“先锋牛牛可以开挂吗”... 您好,先锋牛牛这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,...
独家解答“上海明星麻将辅助器”... 无需打开直接搜索微信;【5848499】操作使用教程:1.亲,实际上上海明星麻将是可以开挂的,确实有...