过去两年的汽车发布会,算力绝对是C位中的C位。车企们把智驾芯片当手机CPU来吹,PPT上动辄500TOPS、1000TOPS甚至2000TOPS,仿佛数字越大,车子就越聪明。
但最近大家发现,车企突然不卷算力数值了。
这就奇怪了,曾经趋之若鹜的“大算力”怎么突然不香了?是算力已经过剩了吗?答案恰恰相反。今天就来聊聊:你花钱升级的大算力,可能大部分都被浪费了。
一、虚高的峰值算力
先搞懂一个关键概念:车企吹的TOPS,全称是每秒万亿次运算,衡量的是芯片的理论峰值算力。这就像手机跑分,能证明硬件底子,但不代表实际体验。
真正决定智驾聪明度的,是有效算力——芯片运行真实负载时的实际吞吐能力,计算方式是模型总运算量除以每帧计算延迟。
行业数据显示,有效算力往往只有峰值算力的20%-40%。比如热门的英伟达Orin芯片,峰值算力254TOPS,实际能发挥的效能仅50-100TOPS。为啥会有这么大差距?多余的算力全被两道“墙”吃掉了。
第一道是存储墙。车载摄像头每秒产生海量数据,DDR存储的带宽根本跟不上数据搬运需求。就像大厨切菜飞快,配菜员却慢吞吞,大部分时间大厨都在等食材。
第二道是功耗墙,芯片藏在仪表盘下方的密闭盒子里,夏天暴晒后环境温度可达60-80℃,为了不被烧毁,芯片只能降频或轮流休息,算力自然大打折扣。
二、破局关键:不堆硬件,转而压榨算力效率
峰值算力虚高的泡沫,行业早晚会戳破。今年AI圈的竞争给出了新思路:谷歌靠“堆芯片”力大砖飞,而DeepSeek靠架构优化提升效率,用更低成本实现了近似效果。
这和国内智驾供应商卓驭科技的思路不谋而合——与其盲目堆峰值算力,不如静下心提升有效算力。
卓驭科技给出了一套组合拳。首先是模型瘦身,把AI计算常用的32位浮点数(FP32)换成精度和体积更小的8位整数(INT8),相当于把公路上的重型卡车换成轻量化小车,大幅减少带宽占用。
为了避免精度降低影响安全,他们采用QAT量化感知训练,让模型在训练时就适应低精度环境,部署后反应速度不衰减。
在计算端,卓驭基于高通SA8650P异构芯片深度优化,通过精细分块技术把图像数据适配高速缓存大小,让AI算法在芯片内部高速缓存完成运算,减少外部存储访问;同时通过算子融合技术,把原本三次的内存访问压缩为一次,大幅降低带宽需求。
此外,他们还对模型进行结构化剪枝,剔除冗余的神经元连接,提升整体效率。
更关键的是数据训练优化。卓驭通过自动化工具链提升数据质量,优化训练策略,让模型在相同算力下表现更好,相同表现下算力需求更低。
三、高效算力才是未来:既接地气,也能望星空
可能有人会问,效率提上去了,是不是就不需要大算力了?答案是否定的。高效算力不是扼杀大算力需求,而是更好地释放其价值。
卓驭的实践印证了这一点:向下,它能把16-32TOPS入门级芯片的性能压榨到极致,让高阶智驾不再是豪华车专属,实现科技平权;向上,这套高效架构能支撑更高算力平台,为未来的端到端VLA模型、世界模型铺路。
未来智驾不仅要能看路,更要像人类一样理解世界、预测未来,这些技术需要的是海量有效算力,而非虚高数字。
如今车企不再卷算力数值,正是行业回归理性的表现——决定智驾体验上限的,不是算力有多大,而是算力能用多少。
卓驭正在构建的移动智能基座模型,已打通感知、决策、控制全链路,还延伸到重卡、L4级自动驾驶等新赛道。
说到底,高效算力不是终点,而是稳固的地基。未来的智驾竞争,既是算力大小的比拼,更是算力效率的较量。
只有两者协同提升,才能真正通往万物智能的时代。