2025年11月21日,小米集团正式发布具身大模型MiMo-Embodied,并宣布该模型全面开源。此举旨在推动智能系统在复杂场景下的能力融合与协同发展。
随着具身智能在家用环境中的逐步应用以及自动驾驶技术向规模化落地迈进,行业面临一个共性挑战:如何实现机器人与车辆在认知与执行层面的能力互通?室内交互智能与室外驾驶智能是否能够相互促进、协同发展?针对这一问题,小米推出跨域具身基座模型MiMo-Embodied,致力于打破领域壁垒,构建统一的智能架构。
长期稳定更新的攒劲资源: >>>点此立即查看<<<
据官方介绍,MiMo-Embodied是目前业内首个成功连接自动驾驶与具身智能两大领域的通用模型,首次实现了对两类任务的统一建模。该模型的推出标志着通用具身智能研究从单一场景专用向跨场景协同迈出了实质性一步。
其核心技术体现在三个方面:
第一,具备跨域能力覆盖。模型同时支持具身智能的核心任务,包括可供性推理、任务规划和空间理解;也涵盖自动驾驶的关键环节,如环境感知、状态预测与驾驶规划,形成贯通室内外场景的全链路智能支撑。
第二,实现双向协同赋能。通过实验验证,模型展现了室内交互经验与道路驾驶决策之间的知识迁移与协同增强效应,为多场景智能融合提供了新的技术路径。
第三,采用全链路优化策略。训练过程中融合“具身与驾驶能力学习—思维链推理增强—强化学习精细调优”的多阶段方法,显著提升了模型在真实复杂环境中的稳定性与可靠性。
在涵盖感知、决策与规划的29项核心基准测试中,MiMo-Embodied展现出领先性能,整体表现优于当前主流的开源、闭源及专用模型:
在具身智能相关测试的17项基准中取得最先进水平,刷新了任务规划、可供性预测与空间理解的能力上限;
在自动驾驶相关的12项基准中表现突出,实现了从环境感知到驾驶决策的全流程性能突破;
同时,在通用视觉语言任务中也展现出强大的基础理解能力和广泛的泛化性,在多项关键指标上实现显著提升。
目前,MiMo-Embodied的模型权重与代码已面向全球开发者开放。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述