就在昨天,金融圈和 AI 圈同时炸了锅。在 nof1.ai 举办的 Alpha Arena 1.5 赛季中,那个代号为「Mystery Model」(神秘模型)的幽灵选手终于揭开了面纱。

它是来自 xAI 的 Grok 4.20。在为期两周的比赛里,它把手里 1 万美元的本金变成了 12193 美元,结算成绩时综合回报率 12.11%。
成绩已结算(限时两周),但模型炒股仍在运行中这听起来似乎不多?但在同样的市场环境下,那些被吹上天的 GPT-5.1、Gemini 3.0 Pro 和 Claude Sonnet 4.5,全部亏损。
这是真金白银的华尔街大逃杀。Grok 4.20 不仅赢了,还把对手的脸按在地上摩擦。
赛博斗兽场:Alpha Arena
这是由 nof1 实验室打造的一个「全自动金融角斗场」。规则很简单:给每个顶尖大模型 1 万美元真钱,扔进残酷的美国股市,不准人类插手,让它们自己决定买什么、卖什么,甚至何时加杠杆。
在这个 1.5 赛季,战场从狂野的加密货币转移到了更为老练的美股市场。为了增加难度,主办方还设计了四种变态模式,包括不仅要赚钱还要极度克制的「苦行僧模式」,以及允许查看对手底牌的「情境感知模式」。
一场单方面的屠杀
比赛结果出来时,数据尴尬得让人想替其他大厂找个地缝钻进去。当 OpenAI 的 GPT-5.1 还在犹豫不决(剩下 9737 美元)时;当谷歌的 Gemini 3.0 Pro 因为操作失误巨亏近 30%(剩下 7382 美元)时;Grok 4.20 却像个老练的华尔街赌徒,冷静地收割着利润。
最讽刺的是上一代 Grok 4 也参赛了,结果垫底,亏得只剩 4610 美元。这恰恰证明了 xAI 在版本迭代上的惊人飞跃 —— 从「韭菜」进化成「镰刀」,马斯克只用了一个版本号。
它凭什么赢?
Grok 4.20 的胜出,或许早已注定。有分析指出,与其他只能通过普通联网搜索新闻的模型不同,Grok 拥有一个核武器级别的优势:它可以实时访问 X 的完整数据流。
在股市里,情绪就是金钱。当其他 AI 还在啃枯燥的财报时,Grok 可能已经通过分析推特上的数百万条推文,嗅到了散户对 Palantir (PLTR) 公司股票的狂热。
事实也证明了这一点。在比赛的「苦行僧模式」中,Grok 4.20 极其嚣张地对 PLTR 开了 10 倍杠杆。理由?它捕捉到了「AI 叙事」的宏观利好。这笔交易直接为它带来了 465 美元的浮盈。
而在另一个战场,它稳稳拿住了微软 (MSFT) 和代号 XYZ100 的仓位,即使市场震荡也纹丝不动,展现出了惊人的定力。
更可怕的是在「情境感知模式」下,Grok 4.20 一度拿下了近 50% 的收益。这个模式允许选手看到对手的持仓。Grok 不仅读懂了市场,还读懂了对手。它预判了 GPT 的预判,这才是最令人细思极恐的地方。
马斯克揭晓谜底
胜利之后,马斯克自然不会放过这个炫耀的机会。他在 X 上得意地确认了 Grok 4.20 的身份。

如果一个 4.20 版本已经能把其他顶尖 AI 杀得片甲不留,那么那个传说中的 Grok 5 会是什么?一个能操纵市场的超级怪兽?
Alpha Arena 的这场比赛给所有人都上了一课。对于华尔街的基金经理们来说,那个曾经被轻视的 AI,现在正盯着他们的饭碗。它不需要睡觉,没有恐惧,而且它比任何人都更早知道你在 X 上骂了哪家公司。当算法学会了贪婪,它收割世界的方式,甚至不需要流一滴血。
参考资料:
https://x.com/MarioNawfal/status/1997476276639264932
本文来自微信公众号:新智元(ID:AI_era)
]article_adlist–>
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>