出品 丨 搜狐汽车·汽车咖啡馆
作者 丨 胡耀丹
“中国智舱AI技术领先欧美不是1-2年,而是1-2个代际。”4月23日,北京车展前夕,斑马智能首席技术官司罗在斑马智能AI-TECH DAY上,投下了一枚深水炸弹。
过去,在智驾行业中,特斯拉被视作汽车智能技术的标杆。而现在,在智舱行业里,中国企业开始成为那个“代际领先”的角色。
司罗这句定义背后,是斑马智行成为中国市场智舱AI冠军后的底气。按2024年收入计算, 斑马智能是中国最大的以软件为核心的智能座舱解决方案供应商, 同时根据同一资料来源,按解决方案搭载量计算亦排名第一。
但斑马智能的野望,不再局限于智能座舱。在AI-TECH DAY上,斑马智能正式宣布,其名字从“斑马智行”改为“斑马智能”。
两个字的变化,宣告着其人工智能公司而非单纯座舱系统供应商的身份。活动现场,元神AI汽车机器人大脑升级、Auto Omni全模态端模型产品矩阵发布、行业首个“龙虾上车”方案Auto Claw亮相,三大重磅动作连发。
“我们认为好的智舱AI就是能和人顺畅交流,协作办事。”斑马智行首席产品官蔡明说。而这三款产品,恰好回答了“交流”与“办事”如何被重新定义。
交流能力的跃迁,来自元神AI。元神AI的核心变化是从“随叫随醒”变成“呼吸式存在”。过去的语音助手缺乏感知、记忆、理解场景能力,唤醒后工作、说完即休眠。元神AI通过端侧全模态模型实现始终在线的感知和记忆:识别车内视觉、环境声音、用户习惯,主动触发服务而非被动响应指令。
Auto Omni是这一能力的底层支撑,其会提供类人自然交互和全域主动智能。Auto Omni中有两个核心产品板块,一是端智能交互中枢,二是生成式场景引擎。据介绍,AutoOmni产品矩阵支持Qwen 3.5 Omni以及MoE架构等不同基础模型,并广泛适配国内外主流大算力芯片。
“今天我们用斑马的Auto Omni,主要是支撑智能车、车机器人的演进和迭代,未来也一定会拓展到其他的智能端。”蔡明说。
Auto Claw解决的是复杂任务规划问题。当前,部分AI“办事”仍是单任务阻塞式调度,即一句话多个指令顺序执行,中途打断即丢失。Auto Claw建立任务池+大模型动态编排,支持任务依赖管理、目标变更调整、异常自我恢复。同时,其采用端云混合架构,端上运行30B MoE模型,敏感规划和记忆留本地,仅必要交互上云,配合独立沙箱和Token管控,解决权限滥用和成本失控问题。
“(行业长期竞争的)核心是技术加生态。”在接受媒体采访时,司罗表示,在生态上,斑马智能以更加开放的形态,去拥抱整个生态,如阿里巴巴、腾讯、爱奇艺等。蔡明介绍,斑马智行一直在积极开拓车载生态服务业务,是行业内最早把生态服务进行AI化,转化成Agent的厂商。
“斑马是一家有完整能力的公司,有些公司更多的是在做框架,不做真正的OEM厂商交付。”司罗同时也在不断强调斑马的落地能力,他表示,斑马有从能力设计、能力实现、研发、交付,到之后整体的问题响应等一套完整机制。在多年交付经验中,斑马建立了一套标准的流程。
面向未来,智驾解放双手、智舱承载生活的理想状态虽未到来,但却存在不小的想象空间。“智舱结合智驾,未来有望达到千亿甚至万亿规模。”司罗说,未来,车辆会变成独立的移动私密空间,催生大量商业变现场景,不只是出行,还可满足午休、休闲娱乐、小型社交等需求,整体市场体量极具想象空间。
2026年被视为智能座舱端AI技术的爆发元年。作为汽车智能头部公司,斑马智能站在了这场革命的前沿。
以下为部分采访速记(经编辑整理):
媒体:您觉得汽车智能体可持续的商业模式是什么样的?
蔡明:和流量费是一模一样的。我认为订阅是基础,再往上可能会泛化出一些表象的东西,我觉得车厂分利润也是必须的,因为从车讲,那个端是他的,所以我们现在认为应该是跟车厂去联运,通过订阅的方式大家分润,这应该是比较可行的路径。
媒体:未来3到5年,从现在车载AI或者是Agent的发展来看,真正决定体验上限的点是在哪?是工程能力、还是说数据上面的量达到一定的程度,斑马最先想在哪一块实现突破?
蔡明:我认为是三个并列一起要努力的,第一个是模型,模型跃进以后上限一下会变高。第二是数据,今天模型都是通用的,不会针对任何一个端或者场景。今天斑马有很多智能座舱的数据,这也是一个重要的点。第三,模型没办法直接承接场景和使用,外面要弄个架构,就像今天我们不能直接用一个工具去工作,总要做一个平台、一个主板。
所以我认为是模型、数据、模型调度系统这三个,此消彼长,这一段时间模型到一定状态没涨,可能其他东西就往上涨,来回迭代向上,这跟原来其他的智能比较像,都是这个过程。
媒体:今天咱们也发了AutoGlow龙虾类的智能体,想了解下车厂这边的接受度怎么样?之前看到有的企业是激进派,也有比较谨慎的,还有反复横跳的。
蔡明:这对我来说既是问题也不是问题。所有新鲜事情都会面临概念阶段,车企接受或不接受,尤其是不接受。热的OpenClaw,本质不算ToC的。现在大家用的手机才是ToC,目前还没到这个阶段。
最重要的有两个事,一个是token的消耗问题,一个是权限滥用的问题。我们做的AutoGlow产品,更多还是这个思路,而且这个思路去年9月份我们在云栖大会自己发的时候就已经确定要干了,只是大家不谋而合,做这种复杂任务,只能这么办。这一定会有个发展过程,一开始不收费、有风险,逐渐成熟后就好了。
所以车企接不接受,本质是我们的产品有没有到那个完成度,用户需求是极其清晰稳定的,肯定会有需要,关键是我们能不能做好,这是对我们的考验。我也不知道现在车企的具体态度,也不是很关心,更多是把自己的产品做好,用户需求太稳定了,不是某一个车厂态度能决定的,关键我们能不能做好。
媒体:您预计何时与车企推进项目落地与部署?
蔡明:我们希望尽快推进,预计两个月左右,首个版本就可以务实推进合作与落地探讨。
媒体:今年端模型会迎来爆发,节奏是否会领先车载硬件迭代?目前不少硬件端部署尚不完善,同时斑马如何划分云端与端侧的分工?
司罗:这个问题很有洞察力。斑马已打造完整、全栈的端模型上车方案。
车载领域主流的高通8295芯片,端侧算力与带宽有限,仅可运行0.6B—0.8B小参数模型,覆盖场景与能力较为有限。目前我们已联合多家车企,落地量产级端模型方案。
第二种方案,以8295芯片搭配AI算力盒子,外接英伟达Orin、高通9075等高阶算力硬件,软硬结合实现多模型上车,现阶段已有多家车企定点、预量产及量产合作。
更高阶则是旗舰车载芯片,例如高通8397/8797,原生算力与带宽充足。当前斑马已参与多家车企旗舰车型量产开发,在8397平台多模型项目招标中,已斩获多个定点订单。
媒体:行业都在讨论下一代车载OS,未来是否会以智能体为核心?斑马车载架构与新一代操作系统,会迎来怎样的演进?
司罗:目前我们正处在系统演进的过程中。传统车载OS的底层核心能力不会消失,包括文件管理、资源调度、通信、安全管控等基础能力,是上层所有应用运行的底座。
但传统APP、应用中心这类老旧应用形态,会逐步缩减。智能体带来的全新交互体验,会慢慢替代传统应用,且是循序渐进的过程。
未来车载OS不会被完全颠覆,而是结构升级。即传统基础能力保留,原有应用管理、APP生态相关功能逐步弱化;同时新增模型管理、模型调度等智能化能力,完成操作系统的迭代升级。
媒体:刚才我看会上VCR介绍智能中枢时,全程展示的都是钉钉,但现在手机、车机主流聊天软件都是微信。斑马智行生态和腾讯系统是否存在较深壁垒,后续会不会打通?
蔡明:首先,VCR只是借阿里生态合作伙伴作为演示案例,仅此而已。目前我们的多媒体生态大多为腾讯系,和腾讯合作顺畅,腾讯视频、腾讯音乐都是核心合作伙伴。
其次,日常通讯可依托手机通道实现,无需绑定特定软件,通话联络不受限制,不管是邀约朋友、预订餐厅,都不会受到影响。视频里最终也都是依托通话完成服务,线下餐厅本身也没有微信联络渠道,只是用来演示现有基础设施已经打通、链路通畅。我们的生态选择很多,并非只能使用钉钉,只是刚好结合阿里生态一同展示,并不是单一绑定。
媒体:地平线发布会,同样发布了座舱智能体与舱驾一体芯片,并且提到了内存优化。当下车机内存成本高昂,Agent运行优先级普遍低于智驾,如果遇到大量泛化语义处理需求,内存资源又大多分配给智驾,是否会直接影响Agent运行?除此之外,开发阶段还会主动针对性规避这类问题吗?
司罗:但你提到的现状确实客观存在,因此需要云端一体调度、操作系统适配与模型管控协同完成,不能简单做硬件硬隔离。舱驾资源如果采用物理硬隔离,比如芯片60%算力分配给智驾、40%给到座舱,双方互不占用,即便座舱资源闲置,也无法灵活调配,整体利用率很低。
我们一方面从推理引擎、芯片适配层面做深度优化,提升本地算力效率;另一方面推进云-端能力融合。例如传统端侧运行的ASR语音识别,在车机算力紧张时,可灵活切换至云端运行,虽会增加100至200毫秒延迟,但能大幅降低端侧算力消耗。整体需要全站统一调控,包含端侧算力分配、模型管理,以及云与端整体框架的协同调度。
媒体:在终极形态落地过程中,智能体是否会出现“控制权入侵”?也就是自主执行它判定合理、但用户并不需要的操作。
司罗:这类涉及PhysicalAI车身物理调节的操作,包含座椅移动、按摩、风量大幅调整等功能安全类动作,都需要提前获得用户确认才能执行。
此前行业出现过语音识别错误,导致行车中误触车灯开关等安全案例。斑马长期搭建完整的语音安全校验体系,高危操作都会设置二次确认与权限校验,不会直接执行,也因此没有出现过相关舆情问题。
媒体:2025年9月斑马首创智舱端模型解决方案,端模型为1.0版本,现有智能架构升级为2.0,1.0和2.0之间是否存在代际差异?
司罗:两者在能力上有很多不同。首先是主动智能场景覆盖差异很大。早期方案更多聚焦车内视觉,比如车内遗留物检测、儿童睡眠识别;如今车内场景更加丰富,例如接打电话自动降低音量、后排阅读时自动开启阅读灯。同时新增大量车外主动场景,比如车外主动迎宾、识别车主身份并主动问候。不管是车内、车外主动视觉,还是主动语音能力,都实现全面升级。
第二,我们对整体架构做了大量优化升级。众多能力集中在端侧运行,受限于车载算力、芯片与内存条件,必须通过系统化、结构化的技术优化,保障运行效率。
第三,如今我们能提供更完整的整体解决方案,不再局限于单点能力。早期主要适配8397芯片,目前覆盖AIBox、8295单SOC等多种形态。本次北京车展,我们还将展出基于高通9075芯片的AIBox方案,也是业内首款。规避广告法表述,该方案在主流同类产品中,具备较高的性价比。
媒体:相同语音指令,不同车企的执行逻辑、座舱操作标准都不一样,车企有很多自研定制逻辑。请问斑马是否需要针对每家车企逐一沟通适配?
司罗:我们理想状态是标准化标品交付,这是提升交付效率、优化商业模式的最优方式。但结合国内市场现状,完全标品很难落地。各家主机厂都希望打造差异化特色,普遍存在定制化需求。斑马依托多年量产交付经验,持续搭建标准化能力与高效流程,最大化压缩定制开发比例,高效管理个性化需求与项目变更。
媒体:量产落地的壁垒,具体体现在哪些方面?
司罗:首先,斑马具备全流程完整落地能力。很多同行只做上层框架,整车量产交付依赖外包合作;而斑马从方案设计、研发落地,到量产交付、售后问题响应,拥有完整闭环体系,能保障交付体验统一。智能座舱行业迭代速度极快,产品还未形成稳定标品,下一代技术就已迭代,外包模式很难跟上节奏,这是我们的核心差异。
第二,依托多年量产经验,搭建了完善的流程体系,涵盖人员管理、需求准入、变更管控、问题校验等全环节,形成成熟的项目管理与交付体系。
第三,持续推动核心能力标准化沉淀。
媒体:哪些内容属于你们的核心标准化能力?
司罗:以端侧能力为核心,包括端上模型能力、自研Multlora整体框架,以及记忆管理、数据管控、安全监控等体系化能力。同时,斑马自研推理引擎,也是核心特色。
Agent基础能力会做标品化设计,但不同车企、尤其海外厂商,对端侧应用定义不同,仍会保留适度定制空间,满足品牌差异化需求。
媒体:现在行业都在提AI原生座舱,在您看来,具备哪些特征才能称之为AI原生座舱?
司罗:首先,以大模型为核心驱动,而非传统小模型流水线架构,这一点至关重要。第二,必须实现端云结合,不能只依赖纯云端架构,行业整体也在快速向端云融合发展。第三,一定要具备开放生态。即便做到AI原生,如果只能运行少量自有应用,也无法发挥价值,AI原生一定离不开开放生态。
媒体:地平线自研硬件、操作系统及上层应用,对比斑马,它在底层硬件层面是否具备天然优势?
司罗:这块我不便直接评价,更适合由高通来解答。我们也愿意适配地平线平台。但芯片平台之间的优劣对比,应由芯片厂商作答。从操作系统和座舱生态来看,地平线的布局情况,我们不便评判。大量生态服务合作多为长期绑定、非开放状态,并不是随时可以接入的。
媒体:司罗总加入之后,给团队带来的最大变化是什么?
蔡明:变化非常大。行业方向一直都在,但缺少核心引领时,团队会不断试错、多线摸索。团队人员有限,摆在面前二十个选择,和精简到两三个核心方向,推进效率完全不一样。
司罗:很多战略选择与落地决策,都是斑马管理层共同协作完成的。
媒体:司罗总加入之前,团队是不是多条路线同步探索?
蔡明:是的。因为前期存在很多不确定性,方向无法精准判断,就会全都尝试。判断能力越强,选择越聚焦;判断模糊时,会觉得每条赛道都有机会,导致力量分散。即便方向都正确,过度试错也会消耗大量精力与时间。
媒体:如何看待车载AI赛道竞争格局?结合企业规划,哪个业务会最先迎来千亿级智能体产业产值爆发?
司罗:智舱结合智驾,未来有望达到千亿甚至万亿规模。一旦L4级Robotaxi落地,用户无需专注驾驶,车内碎片化出行时间将全面释放。我本身容易晕车,在车上很少看手机,也代表一类用户需求。未来车辆会变成独立的移动私密空间,催生大量商业变现场景,不只是出行,还可满足午休、休闲娱乐、小型社交等需求,整体市场体量极具想象空间。
媒体:一句话总结,行业长期竞争的核心决胜点,是技术、生态,还是商业模式?
司罗:核心是技术加生态。国内商业模式同质化严重、极易复刻,无法形成长期壁垒。
媒体:公司已推出两轮车、机器人等多品类AI终端方案。请问目前业务核心是否仍聚焦智能座舱,还是已全面布局多终端落地,同步推进平台化升级?
蔡明:两轮车智能化,本身就是四轮汽车技术5至7年后的下沉趋势,目前行业普遍在加码布局。
我们现阶段核心重心,仍是智能汽车的迭代升级,汽车也是最早落地的移动机器人载体,是公司主业。同时依托现有技术平台的复用性,适度横向拓展其他智能终端,但不会分散主业资源、影响核心业务发展。