机器之心编辑部
]article_adlist–>
最近,一个新词引发了广泛讨论:「Tokenpocalypse」(Token 末日)。
起因是微软对 GitHub Copilot 进行了一次定价重构。从 6 月 1 日起,Copilot 全面转向基于 token 的计费模式,不同模型之间的 token 成本乘数差异巨大,部分模型的单 token 价格是其他模型的 60 倍。

相 关链接:https://gi thub.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/
而那些被用户公认为「真正好用」的高级模型,恰恰是涨幅最凶的那一批。
随着 Anthropic、OpenAI 等多家头部 AI 公司筹备上市,AI 公司将面临更加严峻的盈利压力,或许将迫使更多厂商跟进涨价。
使用 AI 的成本永远是企业扩张生产力不可避免的问题。前段时间兴起的 「tokenmaxxing」 风潮,比拼员工 Token 使用量的驱动力,随着 Token 末日的临近而将走到尽头。
「整个 tokenmaxxxing 的风潮,从兴起到巅峰再到被嫌弃,一共就六个月,」
企业的两难
这位来自大型企业的开发者描述了一个荒诞的困境:公司长期以来强制要求员工使用 AI 工具,token 用少了会被约谈。但新定价一来,token 用多了同样会被约谈。

更要命的是,Copilot 团队到目前为止还没能上线「员工级别 token 限额」功能。这意味着在新计费模式下,一个员工就可能在一天内烧光整个公司当月的 token 预算。
「我的工作已经不是用软件解决业务问题了,」这位开发者写道,「我的工作变成了解决 token 使用问题。」

评论区的吐槽更加精彩。一位用户总结道:「公司政策变成了:『用 AI 做所有事情,但小心别用太多,因为如果 LLM 消耗了太多 token 你会被停用,然后你会因为这个月剩下的时间没用 AI 而被批评。』」
企业过于重视 AI 生产力,可能也是一把双刃剑。

某位来自大型律所的信息主管甚至在 AI 研讨会上「炫耀」:他们的 AI 系统宕机后,律师们基本停工了,因为已经离不开 AI 了。
一个受过多年专业训练的人,居然自由地承认自己离了 AI 聊天框就不能工作?我会羞愧到开始反思自己的职业生涯。」
U ber 超支事件:行业缩影
现在大部分 AI 模型都有用量包,企业在控制预算上的问题,在 Token 逐渐按量计费的趋势下愈发严重。

Uber 在一个半月内走完了一条完整的弧线:先是发现「AI 预算比预想的烧得快得多」,然后紧急设置使用上限和员工限制。

相关链接:https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs
「想象一下,像 Uber 这样大量使用 AI 的公司都会这么快碰壁,」TechCrunch 的播客中谈到,「问题就是:AI 实验室能不能把成本降到和客户的支付意愿对接上?」
一个冷知识:ChatGPT Plus 最初定价 20 美元/月的时候,并没有什么战略考量,「就是随便吐了个数字出来」。整个行业到现在还在为这个起点买单。
「你的工作不会被 AI 取代,但你的预算可能会」
Reddit 上还有更多耐人寻味的细节。有人在公司建了一个 AWS Bedrock 成本监控面板,把每个模型、每个 token(包括缓存 token)的花费实时投到 CloudWatch 上,「让开发者和财务一起看钱烧」。评论区的反应是:「恭喜,你刚给他们提供了一个新的 KPI 指标。」

另一家大公司已经遭遇了类似的紧缩:AI 额度用完后,所有人被强制降级到 GPT-4.2,连 VSCode 集成都没了。
一位不在科技行业的旁观者说出了很多人的心声:「这整件事消耗的精神能量和实际工时,已经多到影响了真正能帮公司赚钱的工作交付。」
当整个行业还沉浸在「AI 将取代一切」的叙事中时,一个更现实的问题已经浮出水面:算力的账单,终究要有人来付。而「Token 末日」或许只是这场清算的开始。
]article_adlist–>
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>