猿力部落——汽车人的技术社区
据AutoTech News报道,小米正式发布了其MiMo-Embodied模型,这是一个将自动驾驶和机器人技术无缝集成的先进人工智能框架。该公司还承诺将该模型完全开源,这标志着具身智能和跨领域人工智能系统发展的一个重要里程碑。
弥合自动驾驶与机器人技术之间的差距
MiMo-Embodied旨在解决新兴的机器人和自动驾驶领域面临的一项紧迫挑战:实现家庭环境中的机器人与道路上的自动驾驶车辆之间的认知和操作互操作性。小米的这项创新正值具身智能在智能家居和出行技术领域日益重要的时期。
小米CEO雷军表示:“通过MiMo-Embodied,我们超越了传统的、特定领域的AI模型。这一统一模型不仅连接了自动驾驶和机器人技术,也为未来多场景AI的发展奠定了基础。”
该模型整合了这两个领域的关键能力,使其能够处理各种任务,例如室内机器人、空间推理、任务规划以及复杂的驾驶操作,如环境感知、状态预测和驾驶策略制定。
MiMo-Embodied的关键特性
(1)跨领域智能:
MiMo-Embodied融合了具身智能和自动驾驶中的几项关键任务。这包括机器人领域的可供性推理(理解与物体的潜在交互)、任务规划和空间理解,以及自动驾驶的核心任务——环境感知、状态预测和驾驶规划。这使得该模型能够提供全场景智能,并可在家庭环境和动态道路条件下无缝运行。
(2)跨领域协同智能:
小米的模式还强调“双向协同智能”,实现室内机器人和自动驾驶车辆之间的知识转移。例如,家用机器人决策能力的提升可以增强其道路驾驶性能,反之亦然。这形成了一个反馈循环,提高了整体系统智能,并支持小米构建更智能、更互联世界的愿景。
(3)实际应用性能与优化:
MiMo-Embodied采用多阶段方法进行训练,包括能力学习、思维链(CoT)推理增强和强化学习(RL)微调。这种稳健的训练流程增强了模型在复杂多变的真实世界环境中(无论是在室内还是在道路上)可靠运行的能力。
关键指标突破性表现
据该公司称,MiMo-Embodied模型已在29项核心AI基准测试中展现出卓越的性能,在多个关键领域超越了开源和专有模型。该模型在17项与具身智能相关的基准测试中取得了最先进的(SOTA)结果,包括任务规划、空间理解和可供性预测。在自动驾驶领域,该模型在12项基准测试中超越了竞争对手,为感知、状态预测和驾驶规划树立了新的标杆。
小米还表示,MiMo-Embodied在视觉语言任务中展现出令人印象深刻的通用性,表明其具有跨不同人工智能领域的广泛泛化能力。这使得该模型不仅是机器人和自动驾驶的工具,更是迈向更先进、多功能人工智能系统的垫脚石。
开源促进创新
秉承小米对透明度和协作的承诺,该公司已将MiMo-Embodied模型及其代码库完全开源。通过向开发者和研究人员开放该模型,小米旨在加速机器人、智能出行和人工智能生态系统的创新,并鼓励全球科技界的贡献。此举彰显了小米超越传统消费电子领域,致力于塑造人工智能未来的雄心。
随着MiMo-Embodied的发布,小米不仅推进了自己的技术发展,还邀请开发者和研究人员在此基础上进行开发,从而培育出一个更加互联互通、更具创新性的AI环境。
目前,小米的重点仍然是完善MiMo-Embodied,并鼓励开发者探索和开发这款强大的AI工具,该工具最终可能会改变从自动驾驶到家庭自动化等各个行业。