小米罗福莉谈Token价格战:建议LLM公司不要盲目压低价格,会导致恶性循环 4月7日消息,小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析,源于两个紧密的时间点:Anthropic几天前切断了Claude第三方工具的订阅通道,而小米MiMo
4月7日消息,小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析,源于两个紧密的时间点:Anthropic几天前切断了Claude第三方工具的订阅通道,而小米MiMo也几乎在同一时间推出了自己的Token Plan。这让她对行业现状有了更深的感触。

长期稳定更新的攒劲资源: >>>点此立即查看<<<
罗福莉的观点可以归纳为几个核心层面,每一层都直指当前大模型商业化的关键矛盾。
首先得承认,Claude Code的订阅机制在计算资源分配上设计得相当精妙。但问题在于,这种设计真的能赚钱吗?恐怕未必。除非其API利润率能高出10到20倍,否则这个模式很可能处于亏损状态。
那么,钱到底亏在哪里?关键就在于第三方框架的接入。以OpenClaw为例,仔细研究其上下文管理机制就会发现,它的设计相当低效。一次用户请求,往往会触发多轮低价值的工具调用,而每一次调用都是一次独立的API请求,并且每次都携带超长的上下文——通常超过10万tokens。
即便有缓存命中,这种操作方式也极其浪费资源。更极端的是,它还会抬高其他请求的缓存未命中率。最终结果就是,每个用户实际触发的API调用次数,可能是Claude Code原生框架的数倍之多。换算成API成本,轻松就是订阅价格的几十倍。这已经不是简单的“差距”,而是一条“巨大的鸿沟”。
当然,Anthropic此举并非彻底封杀。OpenClaw、OpenCode等第三方框架依然可以通过API调用Claude,只是不能再“搭便车”使用用户的订阅额度了。
短期来看,这无疑会给使用这些智能体的用户带来切肤之痛,成本可能轻松上涨几十倍。但话说回来,这种压力未必是坏事。它恰恰能迫使这些第三方框架去优化它们糟糕的上下文管理,去提升提示词缓存命中率,从根本上减少Token的浪费。这种“断奶”带来的痛苦,最终会转化为工程上的自律与进步。
基于以上分析,罗福莉向各大LLM公司提出了一个忠告:在没想清楚如何设计一个不亏钱的编程订阅方案之前,千万别盲目卷入价格战。
把Token价格压得很低,同时完全开放第三方框架,表面上看是对用户友好,但实际上,这正是Anthropic刚刚艰难走出的陷阱。更深层的问题在于,如果用户的注意力被消耗在那些低质量的Agent框架上,当他们面对不稳定且缓慢的推理服务时,就只能被迫使用经过降级、只为节省成本的“阉割版”大模型,结果往往是任务仍然无法完成。这对于用户体验和用户留存来说,无疑是一个致命的恶性循环。
关于小米MiMo的Token Plan,其逻辑与Claude新推出的额外使用套餐相似:支持第三方工具,严格按Token计费。目标很明确,就是长期稳定地提供高品质服务,而不是诱导用户冲动消费后迅速“弃坑”。
从宏观视角看,全球计算资源增长的速度,已经明显跟不上Agent爆发所带来的Token需求增长了。那么,真正的出路在哪里?答案不是提供更便宜的Token,而是要让“更高效的Agent框架”和“更强大且更高效的模型”协同演进,形成合力。
从这个意义上说,Anthropic的这次举措,无论其初衷如何,客观上都在推动整个开源和闭源生态向前发展。这或许是一件好事。它揭示了一个即将到来的新时代法则:Agent时代,不属于那些消耗最多算力的人,而将属于最懂得如何高效利用算力的人。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述