「Token末日」来了！AI正迎来一场定价海啸

机器之心编辑部

]article_adlist–>

最近，一个新词引发了广泛讨论：「Tokenpocalypse」（Token 末日）。

起因是微软对 GitHub Copilot 进行了一次定价重构。从 6 月 1 日起，Copilot 全面转向基于 token 的计费模式，不同模型之间的 token 成本乘数差异巨大，部分模型的单 token 价格是其他模型的 60 倍。

相关链接：https://gi thub.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/

而那些被用户公认为「真正好用」的高级模型，恰恰是涨幅最凶的那一批。

随着 Anthropic、OpenAI 等多家头部 AI 公司筹备上市，AI 公司将面临更加严峻的盈利压力，或许将迫使更多厂商跟进涨价。

使用 AI 的成本永远是企业扩张生产力不可避免的问题。前段时间兴起的「tokenmaxxing」风潮，比拼员工 Token 使用量的驱动力，随着 Token 末日的临近而将走到尽头。

「整个 tokenmaxxxing 的风潮，从兴起到巅峰再到被嫌弃，一共就六个月，」

企业的两难

这位来自大型企业的开发者描述了一个荒诞的困境：公司长期以来强制要求员工使用 AI 工具，token 用少了会被约谈。但新定价一来，token 用多了同样会被约谈。

更要命的是，Copilot 团队到目前为止还没能上线「员工级别 token 限额」功能。这意味着在新计费模式下，一个员工就可能在一天内烧光整个公司当月的 token 预算。

「我的工作已经不是用软件解决业务问题了，」这位开发者写道，「我的工作变成了解决 token 使用问题。」

评论区的吐槽更加精彩。一位用户总结道：「公司政策变成了：『用 AI 做所有事情，但小心别用太多，因为如果 LLM 消耗了太多 token 你会被停用，然后你会因为这个月剩下的时间没用 AI 而被批评。』」

企业过于重视 AI 生产力，可能也是一把双刃剑。

某位来自大型律所的信息主管甚至在 AI 研讨会上「炫耀」：他们的 AI 系统宕机后，律师们基本停工了，因为已经离不开 AI 了。

一个受过多年专业训练的人，居然自由地承认自己离了 AI 聊天框就不能工作？我会羞愧到开始反思自己的职业生涯。」

U ber 超支事件：行业缩影

现在大部分 AI 模型都有用量包，企业在控制预算上的问题，在 Token 逐渐按量计费的趋势下愈发严重。

Uber 在一个半月内走完了一条完整的弧线：先是发现「AI 预算比预想的烧得快得多」，然后紧急设置使用上限和员工限制。

相关链接：https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs

「想象一下，像 Uber 这样大量使用 AI 的公司都会这么快碰壁，」TechCrunch 的播客中谈到，「问题就是：AI 实验室能不能把成本降到和客户的支付意愿对接上？」

一个冷知识：ChatGPT Plus 最初定价 20 美元/月的时候，并没有什么战略考量，「就是随便吐了个数字出来」。整个行业到现在还在为这个起点买单。

「你的工作不会被 AI 取代，但你的预算可能会」

Reddit 上还有更多耐人寻味的细节。有人在公司建了一个 AWS Bedrock 成本监控面板，把每个模型、每个 token（包括缓存 token）的花费实时投到 CloudWatch 上，「让开发者和财务一起看钱烧」。评论区的反应是：「恭喜，你刚给他们提供了一个新的 KPI 指标。」

另一家大公司已经遭遇了类似的紧缩：AI 额度用完后，所有人被强制降级到 GPT-4.2，连 VSCode 集成都没了。

一位不在科技行业的旁观者说出了很多人的心声：「这整件事消耗的精神能量和实际工时，已经多到影响了真正能帮公司赚钱的工作交付。」

当整个行业还沉浸在「AI 将取代一切」的叙事中时，一个更现实的问题已经浮出水面：算力的账单，终究要有人来付。而「Token 末日」或许只是这场清算的开始。

]article_adlist–>

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>