首页 > 人工智能 >小米罗福莉谈 Token 价格战：建议 LLM 公司不要盲目压低价格，会导致恶性循环

小米罗福莉谈 Token 价格战：建议 LLM 公司不要盲目压低价格，会导致恶性循环

来源：互联网 2026-05-04 13:50:11

小米罗福莉谈Token价格战：建议LLM公司不要盲目压低价格，会导致恶性循环 4月7日消息，小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析，源于两个紧密的时间点：Anthropic几天前切断了Claude第三方工具的订阅通道，而小米MiMo

小米罗福莉谈Token价格战：建议LLM公司不要盲目压低价格，会导致恶性循环

4月7日消息，小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析，源于两个紧密的时间点：Anthropic几天前切断了Claude第三方工具的订阅通道，而小米MiMo也几乎在同一时间推出了自己的Token Plan。这让她对行业现状有了更深的感触。

长期稳定更新的攒劲资源： >>>点此立即查看<<<

▲ 图源：罗福莉本人社媒账号

罗福莉的观点可以归纳为几个核心层面，每一层都直指当前大模型商业化的关键矛盾。

1. 订阅机制的“理想”与“现实”鸿沟

首先得承认，Claude Code的订阅机制在计算资源分配上设计得相当精妙。但问题在于，这种设计真的能赚钱吗？恐怕未必。除非其API利润率能高出10到20倍，否则这个模式很可能处于亏损状态。

那么，钱到底亏在哪里？关键就在于第三方框架的接入。以OpenClaw为例，仔细研究其上下文管理机制就会发现，它的设计相当低效。一次用户请求，往往会触发多轮低价值的工具调用，而每一次调用都是一次独立的API请求，并且每次都携带超长的上下文——通常超过10万tokens。

即便有缓存命中，这种操作方式也极其浪费资源。更极端的是，它还会抬高其他请求的缓存未命中率。最终结果就是，每个用户实际触发的API调用次数，可能是Claude Code原生框架的数倍之多。换算成API成本，轻松就是订阅价格的几十倍。这已经不是简单的“差距”，而是一条“巨大的鸿沟”。

2. “断奶”之痛与工程自律

当然，Anthropic此举并非彻底封杀。OpenClaw、OpenCode等第三方框架依然可以通过API调用Claude，只是不能再“搭便车”使用用户的订阅额度了。

短期来看，这无疑会给使用这些智能体的用户带来切肤之痛，成本可能轻松上涨几十倍。但话说回来，这种压力未必是坏事。它恰恰能迫使这些第三方框架去优化它们糟糕的上下文管理，去提升提示词缓存命中率，从根本上减少Token的浪费。这种“断奶”带来的痛苦，最终会转化为工程上的自律与进步。

3. 价格战的陷阱与恶性循环

基于以上分析，罗福莉向各大LLM公司提出了一个忠告：在没想清楚如何设计一个不亏钱的编程订阅方案之前，千万别盲目卷入价格战。

把Token价格压得很低，同时完全开放第三方框架，表面上看是对用户友好，但实际上，这正是Anthropic刚刚艰难走出的陷阱。更深层的问题在于，如果用户的注意力被消耗在那些低质量的Agent框架上，当他们面对不稳定且缓慢的推理服务时，就只能被迫使用经过降级、只为节省成本的“阉割版”大模型，结果往往是任务仍然无法完成。这对于用户体验和用户留存来说，无疑是一个致命的恶性循环。