主论坛首现辅助驾驶供应商身影:卓驭科技云栖大会详解端到端如何推动智驾平权
创始人
2025-09-27 18:43:44
0

2025年9月24日至26日,以“云智一体·碳硅共生”为主题的阿里云栖大会在杭州举行。作为国内顶尖的科技盛会,本次云栖大会设立了三大主论坛和110余场聚合话题,吸引了来自50多个国家和地区的2000余位嘉宾。

在众多参展企业中,卓驭作为国际一流的汽车智能化供应商和服务商,受邀亮相大会并参与多个重要环节。卓驭AI首席技术官陈晓智在主论坛环节发表了“全球可享的智驾平权”主题演讲,这充分体现了行业对卓驭技术实力的认可。

本次亮相,不仅展现了卓驭在汽车智能化技术领域的前瞻布局,更传递出其以技术普惠打破行业壁垒、推动“全球辅助驾驶平权”的核心主张,为辅助驾驶规模化落地提供了清晰的“卓驭方案”。

三大能力驱动,端到端架构赋能辅助驾驶普惠

主论坛环节历来是云栖大会的重点内容,也是智能行业风向标。在这一议题下,卓驭AI首席技术官陈晓智以“技术落地”为核心,分享了卓驭近年来的两大关键成果。

据陈晓智介绍,成果其一是中算力平台城市NOA方案的成功推送,该方案首次将城市级领航辅助驾驶功能下放至10万元级车型,自2025年四季度起将在捷途、宝骏等多款车型上通过OTA推送,极大地推动了辅助驾驶的普及化。其二是全球首批燃油车高阶无图城市领航功能落地,卓驭携手大众集团实现无图端到端高速NOA的量产上车,未来将扩展至多款燃油车型,并覆盖奥迪等品牌,引领高级辅助驾驶正式进入“油电同智”时代。

端到端架构作为卓驭推动“辅助驾驶平权”的核心驱动力,随着其辅助技术进步,该架构也在持续进行演进。论坛上,陈晓智总结了卓驭新一代端到端架构的三个核心能力:首先是“一段式端到端”响应能力,实现从视频到轨迹的直接输出,以直觉式反应为用户提供更安全、敏捷的驾驶体验,大幅缩短决策链路。其次是AWM(Action World Model)动作世界模型带来的持续进化能力,该模型基于自回归架构,通过模仿学习与强化学习结合训练,具备“Scaling Law”特性——随参数量与数据量增加,性能可持续提升,且计算高效,适配车端部署需求。最后是推理思考能力,依托多模态理解与COT(思维链)技术,模型可在复杂场景下实现深度推理,同时打造智能化驾驶Agent交互体验,能精准识别用户自然语音指令,让驾驶行为更好对齐用户偏好与意图,使辅助驾驶系统从“机械工具”升级为“懂需求的伙伴”。

增规模、提效率,多维度破解辅助驾驶规模化难题

在9月25日的“Data+AI圆桌派:汽车自动驾驶”环节,卓驭基础设施部总监王鹏从“技术实践”视角,聚焦辅助驾驶领域的算法突破、算力需求与数据管理痛点分享了卓驭的最新进展与解决方案。

王鹏在圆桌讨论中指出:“我们从最初的CV小模型,到BEV/OCC,再到两段式端到端、一段式端到端、VLA和世界模型,效果发生了巨大变化。以卓驭为例,我们的数据资产从零积累到1000万花了整整两年时间,从1000万到2000万花了一年时间,从2000万到1亿仅花了半年。到目前为止仍以很高的速度在增长。”

面对当前辅助驾驶数据多模态管理、全场景检索等行业挑战,王鹏分享了卓驭的先进经验。卓驭构建了自动驾驶数据湖方案,将海量非结构化数据存放在对象存储上,并设计文本、向量、GIS、标签的多模数据检索引擎,支持业务快速自动化地找到有价值数据。

同时,在整体成本优化方面,王鹏分享了一个具体案例:在模型训练过程中,卓驭发现Dataloader部分非常耗时,同时也会造成GPU的浪费。“我们一方面引入更合适的计算引擎框架,另外将Dataloader卸载到支持弹性的CPU资源池。这样整体GPU利用率可以达到98%左右,同时成本也有50%左右的降低。“

最后,王鹏总结了卓驭一直面临的挑战为基础设施的不可能三角:一角是算力和数据的指数级增长,一角是业务方对IO吞吐和计算性能的不断极致要求,最后一角是最优的成本。王鹏表示基于像阿里云这样优秀的云底座,并结合针对行业的定制化基建能力的积累,卓驭有信心可以不断打破不可能三角和促进新的平衡产生。

以技术创新践行辅助驾驶普惠使命

陈晓智与王鹏的分享,共同印证了卓驭坚实的发展底蕴与清晰的技术战略。自2016年成立以来,卓驭已从最初的技术探索者,成长为与超过十家优质车企客户、十几个品牌建立紧密量产合作关系的行业中坚力量。其合作范围横跨国际OEM与国内自主品牌,累计合作量产车型已超过30款,并有30余款车型正在量产进程中,展现出卓越的工程化落地能力和广泛的客户认可度。正是基于如此大规模的量产实践和数据反馈,卓驭才能不断推动技术迭代,并将其赋能至更广泛的车型平台。

通过云栖大会这一行业瞩目的AI盛会,卓驭不仅展示了其在端到端模型、大数据平台与规模化落地上的技术实力,更向行业传递了一个明确信号:高阶辅助驾驶功能正从高端车的专属配置,变为更广泛用户都能享受的普惠技术。目前,随着德国欧洲总部的设立,卓驭正将经过中国市场复杂场景验证的“辅助驾驶平权”方案加速推向全球。

从架构演进到数据闭环,从“油电同智”到全球布局,卓驭正以扎实的工程实践与前瞻的技术布局,推动辅助驾驶走向更安全、更普惠、更智能的未来。

二、云栖技术主论坛发言

主题:全球可享的智驾平权

(以下内容为云栖大会主论坛中,卓驭AI首席技术官陈晓智先生相关发言部分)

大家下午好,我是卓驭的陈晓智。今天很荣幸给大家分享一下我们的主题是全球可享的智驾平权。

1.关于卓驭

卓驭起步于2016年,我们的定位是成为国际一流的辅助驾驶解决方案的供应商和服务商。

过去9年我们实现了一系列的里程碑:包括2019年落成了首个车规级工厂并与大众中国达成合作;2022年卓驭首款合作的量产车型上市;2024年卓驭与多家汽车集团建立了战略合作关系;今年上半年,卓驭发布了端到端视界模型和VLA的方案;在刚过去的德国慕尼黑车展上,卓驭也宣布了在德国设立欧洲总部,以更好地服务海外客户,加速推动辅助驾驶产品在欧洲的落地。

在合作伙伴方面,目前卓驭已经与10家优质的车企客户、10几个品牌,建立了紧密的量产合作关系,覆盖国际OEM、国内自主品牌等诸多优秀的客户。

2.合作成果

今天借此机会,也与大家分享卓驭近期的两个关键量产成果:

第一个成果,是中算力平台城市NOA方案的量产推送。这应该是业界仅有的能够下放到10万级车型的城市NOA方案。今年4季度开始,搭载卓驭端到端大模型的城市NOA功能,将在我们的合作伙伴捷途、宝骏等多款车型上开始推送。这一成果的背后也是卓驭一直以来持续推动智驾平权所做出的努力。

第二个成果,是把无图城市领航高级辅助驾驶功能放到燃油车上。卓驭是最早开始做燃油车NOA方案的供应商,去年喊出了油电同智的口号,今年也兑现了相应的承诺。从8月份开始,卓驭携手大众集团成功量产了端到端高速NOA的功能,近期已经有两款车型成功搭载上市,后续还有10余款车型也会陆续上市,也将覆盖奥迪品牌相关车型,这也是全球首批搭载无图城市领航高级辅助驾驶功能的燃油车。

3.端到端架构演进

再给大家分享一下卓驭近期技术的一些进展:

端到端是目前辅助驾驶的一个主流技术方案,经典的端到端架构指的是基于模仿学习训练的感知+规划的端到端,也是卓驭去年量产的第一代端到端架构。

今年,卓驭端到端架构将会升级为两个方案。一个是端到端世界模型,一个是视觉语言动作模型,也就是VLA。世界模型、VLA、一段式端到端,这些名词最近行业中讨论也比较多,但这些并不是矛盾的技术。

大家常说的世界模型,其实一般指定义在视频空间的世界模型,是部署在云端,用于云端的数据生成,或者说闭环仿真的模型。而一段式端到端只是一种架构,VLA也是端到端的一种实现。所以这些名词其实是不同维度的技术表述,也并非只能二选一的技术路线选择。

针对100~400TOPS的算力的平台,中算力平台、高算力平台,卓驭采用端到端世界模型。也就是视觉基础模型VFM(Vision Foundation Model)+动作世界模型AWM(Action World Model),它其实对应的是VLA的V+A的部分。那其中VFM(Vision Foundation Model),是相比传统感知更强大的一个基础大模型,同时也能输出低时延的一段式的轨迹。而AWM(Action World model)是定义在动作空间的世界模型,相比于视频空间,定义在动作空间的世界模型计算更加高效,更适合车端部署的需求。AWM(Action World model)是基于自回归的架构,通过模仿学习+强化学习训练,可以实现scaling law的特性,也就是说随着模型参数量的增加和数据量的增加,它的模型性能还可以持续的提升。

针对400TOPS以上的旗舰算力平台,卓驭在V+A的基础上架构额外集成了大语言模型升级为VLA架构,VLA可以在复杂场景实现COT思维链推理,同时VLA也能提供更加智能的驾驶agent的交互体验,让辅助驾驶系统不再像是冷冰冰的开车机器,而是能真正听得懂用户的自然语音的指令,能够让驾驶行为更好地对齐用户的驾驶偏好和意图。

在量产车型的迭代中,端到端模型需要做到天级别的迭代速度,才能快速响应和解决客户的问题。因此,卓驭打造了大规模的数据闭环平台。依托阿里云的大数据和人工智能平台PAI的能力,卓驭搭建了超过3 EFLOPS的智算中心和大数据平台,支持十亿级别的场景数据处理和全维度、高效的业务洞察。卓驭搭建了产品和研发的双闭环体系,大模型训推效率、数据处理效率也取得了非常显著的提升。

最后总结下卓驭新一代端到端架构的三个核心能力:

第一个能力,是一段式端到端从视频到轨迹的直觉响应,可以实现安全敏捷的驾驶体验;

第二个能力,是AWM(Action World model)动作世界模型,基于自回归架构和强化学习实现自动驾驶系统的Scaling law,让性能体验可以持续地提升。

第三个能力,是推理思考,通过多模态理解与COT思维链技术,为用户提供驾驶Agent的智能化交互体验。

通过与阿里云在大模型训练、分布式优化以及大数据处理各方面深入的、持续地合作。卓驭端到端的架构也会以最快的速度往前迭代,持续升级,从而为用户提供越来越好用的智能辅助驾驶产品,最终实现全球可享的智驾平权。

三、Data+AI圆桌派

主题:Data+AI圆桌派:汽车自动驾驶

(以下内容为摘取圆桌交流中,卓驭基础设施架构部总监王鹏先生的相关发言部分)

Q:王鹏总,卓驭在智能驾驶方面最大的特点是什么?卓驭在算法上有哪些最新进展?

卓驭-王鹏:主要是两大特点,特点一是坚持软硬一体,特点二是端到端算法。

对于坚持软硬一体主要有三个原因。第一个原因是源于卓驭的基因,因为卓驭最早主要做无人机,比如智能化功能,无人机其实是一个极限的低算力平台,要实现像追踪、定位,一些智能避障功能,挑战是极大的。所以我们只能是极限压榨算力性能,做到性能极致化才有可能实现这些功能。后来卓驭做车载的时候,很自然地想做到软硬一体,这样才能够把算法,把硬件加热到极致,减少一些算力之间的冗余计算。行业内有跨传感器融合的问题,这块其实比较难,因为不同传感器的时间和频率是不一样的。然后对应卓驭发布的激目2.0传感器,它是车规级的传感器,它能天然通过前融合的算法,把激光雷达的点云数据和对应的相机的视频数据天然做一些毫米级的对齐,这就能够解决这个行业难题。

第二个原因,卓驭的愿景是希望科技平权让辅助驾驶功能不只用于高端车,也用于低端车,所以只有软硬一体才能通过硬件的优良设计,加上算法的极致优化,做到最终成本的最低。

第三个原因是卓驭的定位,卓驭服务于优秀的OEM。卓驭需要为OEM提供辅助驾驶子系统的兜底能力。如果卓驭在负责辅助驾驶,那不管是硬件有问题还是软件有问题,最后都找到卓驭。卓驭只有软硬一体才能帮车企做好兜底。

卓驭发布了高悟性端到端2.0,包括端到端模型、VLA模型,包括一些世界模型。V指的是vision的视觉基础模型,L是语言模型,A是动作世界模型。基于VLA可以实现无图车位到车位以及千人千面的驾驶体验,还通过语音来控制的功能。

追问:从您的观察来看,当前智驾算法的发展是否还遵循Scaling Law——也就是通过持续扩大数据和模型规模来提升性能?还是说我们正在接近它的边际?

卓驭-王鹏:目前看仍然是遵循Scaling Law的,随着端到端和VLA模型的全面量产上车,对于训练算力和存储的需求也是指数级的增长。我们可以看到市场上领先的智驾技术团队的基础设施沉淀非常惊人。对于卓驭而言,持续扩大算力规模和数据规模,以及如果在有限的时间空间中发挥更大的效能,一直是我们挑战和持续优化的技术竞争力。

Q:在模型训练阶段,尤其是大模型或端到端模型训练过程中,卓驭遇到的核心痛点是什么?有哪些值得分享的最佳实践?

卓驭-王鹏:核心痛点是海量非结构化数据的元数据管理,怎么支撑好价值数据的挖掘。

数据量从0积累到1,000万,大概花了两年时间。卓越从1,000万积累到2,000万,花了一年时间。从2,000万积累到一个亿只花了半年时间,而且增长速度仍然很高,所以面临数据增长速度非常快。

Q:卓驭认为数据方面,有哪些痛点呢?

卓驭-王鹏:主要的痛点是数据量非常大,因为是非结构化数据,比如像图像视频点云,对应LLaMa模型训练的时候,可能对应的数据量偏少一些,可以达到几十PB甚至到几百PB。但训练母模型的量是非常巨大的,这么海量的数据,怎么去挖掘里面的核心价值数据?

主要是借助阿里云的能力,同时构建卓驭的多模态数据管理以及检索引擎,在统一引擎里,既支持对应的文本类,也包括向量的、GIS的,还包括一些标签数据。为了精细化后续的挖掘,甚至对每一帧做标签化处理。每一帧可能有几百个行为标签或者场景标签,量大概在百亿或者到千亿级别,非常巨大。卓驭构建了统一的元数据管理引擎,引擎既能支撑跨模态数据的即时检索的TP类型的需求,同时也能支持统计分析,然后导出对应的训练Train List的AP场景,也包括TP场景,这是一个挑战。

第二个挑战是成本,对于模型训练,尤其对AI类的模型,跑一次任务很多钱就花出去了。所以对应算力和存储资源就要求成本优化,卓驭做了很多优化。以下是两个例子,其一是存储,卓驭跟阿里云一起合作构建了多层存储管理体系。在体系之下,能够通过智能数据流动方式预知到,模型训练下一步要有哪些数据,甚至哪一帧的数据。基于这个能力,能把它用的数据给它放到高性能存储上去。它不用的数据,或者说长时间不用的数据,就下沉到容量性存储甚至归档性存储里面去,这样能大幅度降本。

还有一点,在模型训练前面会有dataloader过程,这个过程主要是把数据加载进来,不是做预处理。主要在于跑CPU型的密集型任务,一方面会导致效率比较低,另一方面GPU利用率也上不去,就会导致 GPU的空耗,就是闲置浪费。

卓驭采用了Ray的新型框架,同时把loader卸载到CPU型机器集群上去,集群同时支持弹性,这样可以把deload过程大幅度的减少时间,效率提高,保证GPU利用率非常高。GPU利用率在云上能达到95%,最高能到98%,非常高。整体降本在50%左右。

相关内容

热门资讯

退役电池冲击锂电市场,合规品牌... 随着我国新能源汽车产业的迅猛发展,新能源汽车保有量已突破3140万辆,庞大基数背后,动力电池退役浪潮...
上汽奥迪全系集结广州车展:电动... 导语:豪华战场再发力,上汽奥迪携全矩阵征战广州车展。 11月21日,第二十三届广州车展如期开幕,新能...
欧瑞博智能化+电气化正成为科技... 来源:第一家电网 随着“十五五”规划明确提出“提高终端用能电气化水平,推动能源消费绿色化低碳化”,居...
哈弗亮相广州车展 传递年轻化理... 11月21日,哈弗品牌以“与哈弗一起 粤活粤年轻”为主题,开展了一场围绕“年轻”的交流活动,不仅展示...
2025广州车展|陈萃:MG4... 出品 | 汽车咖啡馆 11月21日,2025(第二十三届)广州国际汽车展览会开幕,作为行业权威媒体,...
主动服务沿沪宁产业创新带建设,... 来源:滚动播报 (来源:上观新闻) “我们在园区的推荐下,正在与南通对接购地意向。”Autolab...
对话柳长庆:从品牌焕新到战略升... 2025年即将落下帷幕,这是中国汽车市场在混战与严重“内卷”中艰难前行的一年。各大品牌在配置、智能与...
原创 锂... 锂空气电池因轻量特性和高能量密度,对电动航空器和电动汽车发展至关重要。 电动飞机的梦想与优质电动汽...
上汽奥迪2025广州车展发力:... 在2025广州国际车展上,上汽奥迪以双品牌全系阵容惊艳亮相,全面展示其在电动化与智能化领域的战略布局...
37.99万起!岚图泰山上市捅... 将冲击豪华汽车市场作为目标,而备受关注的大六座旗舰SUV车型岚图泰山近日正式上市,价格从37.99万...