小米大模型“一月一更”:MiMo-V2.5系列发布,智能体赛道再提速 4月23日消息,距离3月18日那场一口气发布三款自研大模型的发布会,仅仅过去了36天。就在4月22日深夜,小米再度出手,正式推出了新一代的MiMo-V2.5系列大模型。这个系列阵容不小,涵盖了MiMo-V2.5、V2.5-Pro、
4月23日消息,距离3月18日那场一口气发布三款自研大模型的发布会,仅仅过去了36天。就在4月22日深夜,小米再度出手,正式推出了新一代的MiMo-V2.5系列大模型。这个系列阵容不小,涵盖了MiMo-V2.5、V2.5-Pro、V2.5-TTS Series和V2.5-ASR四款模型。
其中,旗舰型号MiMo-V2.5-Pro和通用型号MiMo-V2.5,将于近期面向全球开源。同时,小米也预告了V2.5-TTS Series和V2.5-ASR即将推出。这种“一月一更”的迭代节奏,业界称之为“小米速度”。它正清晰地表明,这家手机巨头在大模型赛道上,已经从“低调赶路者”加速蜕变为一位不容忽视的“高调竞争者”。
长期稳定更新的攒劲资源: >>>点此立即查看<<<
消息发布后,小米创始人雷军迅速转发了MiMo-V2.5-Pro的相关表现,并配文道:“继续进步!”

那么,这次发布的V2.5系列究竟有何不同?简单来说,它延续并强化了小米“为Agent(智能体)时代打造”的核心思路,构建起一个覆盖旗舰推理、全模态交互与语音能力的全栈模型矩阵。
作为系列中的王牌,MiMo-V2.5-Pro被定位为“为长难Agent任务而生”。在通用智能体能力、复杂软件工程以及超长程任务处理这些关键维度上,它已经具备了与全球顶尖Agent模型如Claude Opus 4.6、GPT-5.4正面较量的实力,相比上一代的MiMo-V2-Pro,可谓实现了全方位的跃升。

根据内部测试数据,MiMo-V2.5-Pro在搭配合适的运行框架后,能够稳定完成单次涉及近千轮工具调用的超长任务。其在智能体场景下的指令遵循能力也显著提升,不仅能精准捕捉上下文中的隐性要求,还能在超长对话周期内始终保持逻辑的一致性。
而MiMo-V2.5则被定位为原生的全模态Agent模型,支持视觉、听觉、文本的一体化理解与转化。其Agent综合能力全面超越了前代V2-Pro,并支持高达100万Token的上下文窗口。与Pro版本相比,V2.5的平均推理速度更快,显然更适合那些对响应延迟敏感的通用Agent应用场景。
相较于V2系列,MiMo-V2.5系列究竟实现了哪些突破?概括来看,主要体现在性能、效率和成本这三个核心维度。
首先看性能,尤其是长程任务能力,迎来了质变。V2.5-Pro在多项基准测试中表现亮眼。例如,在评估AI编程智能体(Coding Agent)的权威基准SWE-Bench Pro上,它取得了57.2分,与Claude Opus 4.6的57.3分几乎持平。
而在小米MiMo团队自研的评估套件MiMo Coding Bench上,MiMo-V2.5-Pro拿到了73.7分,与Claude Opus 4.6(77.1分)的差距进一步缩小。作为对比,上一代的MiMo-V2-Pro得分是71.5分。

技术博客中的一个案例更能说明问题:在一次实现完整SysY编译器的挑战中,V2.5-Pro仅用了4.3小时,经过672次工具调用,就完成了全部工作,并在隐藏测试集上获得了233/233的满分。要知道,北大本科生完成同类项目通常需要数周时间。另一个独立构建Web视频编辑器的任务中,V2.5-Pro历经1868次工具调用,自主构建了包含多轨道时间线、片段裁剪、交叉淡化等完整功能的应用,最终代码量高达8192行。
MiMo-V2.5在多模态理解方面同样进步显著。在全面评估AI智能体解决现实世界复杂问题能力的Claw-Eval多模态评测中,MiMo-V2.5取得了23.8分,相比V2-Omni的15.8分有了明显优化。

其次是效率,核心在于Token利用率的大幅提升。据介绍,MiMo-V2.5系列在Token效率上进行了深度优化。在达到相同Agent评测分数的前提下,V2.5-Pro相比Kimi K2.6能节省42%的Token,而V2.5相比Muse Spark更能节省50%的Token。这意味着什么?意味着开发者可以用更少的资源消耗完成同样的任务,使用成本得以显著降低。
最后是成本层面,小米同步对TokenPlan定价方案进行了一次重大调整。具体包括:取消了此前1Token=4Credits的计费方式,也不再区分256k和1M上下文窗口的Credit倍率;新增了“连续包月”和“包年”订阅模式,为用户提供更多选择;甚至还推出了每日凌晨至早上八点的八折夜间专属折扣。此外,V2.5的消耗倍率为1x,Pro版本为2x,定价策略显得更加清晰和亲民。

从3月18日V2系列发布,到4月22日V2.5系列上线,中间仅仅间隔36天。如此迅猛的迭代速度,其驱动力何在?
小米大模型团队负责人罗福莉曾坦言,“从Chat到Agent范式的转变发生得如此之快,甚至我们自己都几乎不敢相信”。在Agent成为行业公认的AI最重要落地方向的背景下,小米正在借势快速迭代模型能力,目标很明确:抢先卡位移动端智能体赛道。对于小米而言,大模型绝非追赶风口的噱头,而是其智能座舱、IoT设备与个人助手的底层能力支撑,是必须补齐的技术底盘。
雷军在今年3月宣布的未来三年在AI领域投入超600亿元的计划,无疑为这种快速迭代提供了充足的资金保障。巨额的投入,是技术狂奔的底气。
更值得关注的是,模型的快速迭代与终端落地正在形成双向加速的良性循环。就在昨天,小米官方宣布,小米澎湃OS 3 Beta版已向小米17系列等机型推送了名为“龙虾”的智能体Xiaomi miclaw,新增了人格体系、技能体系、跨设备同步等能力,支持80余项系统工具调用。更强的模型能力为终端AI体验提供了坚实支撑,而终端产生的海量真实使用数据,又反过来哺育和优化着模型的进化。
显而易见,在600亿AI投入的强力加持下,MiMo系列的“一月一更”或许才刚刚拉开序幕。对于这家已将AI提升至与汽车业务同等战略高度的科技巨头而言,速度,本身就是最核心的竞争力之一。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述