神秘模型 Grok 4.20 AI 炒股夺冠：只有它赚钱，吊打 Gemini 3 和 GPT-5.1

就在昨天，金融圈和 AI 圈同时炸了锅。在 nof1.ai 举办的 Alpha Arena 1.5 赛季中，那个代号为「Mystery Model」（神秘模型）的幽灵选手终于揭开了面纱。

它是来自 xAI 的 Grok 4.20。在为期两周的比赛里，它把手里 1 万美元的本金变成了 12193 美元，结算成绩时综合回报率 12.11%。

成绩已结算（限时两周），但模型炒股仍在运行中

这听起来似乎不多？但在同样的市场环境下，那些被吹上天的 GPT-5.1、Gemini 3.0 Pro 和 Claude Sonnet 4.5，全部亏损。

这是真金白银的华尔街大逃杀。Grok 4.20 不仅赢了，还把对手的脸按在地上摩擦。

赛博斗兽场：Alpha Arena

这是由 nof1 实验室打造的一个「全自动金融角斗场」。规则很简单：给每个顶尖大模型 1 万美元真钱，扔进残酷的美国股市，不准人类插手，让它们自己决定买什么、卖什么，甚至何时加杠杆。

在这个 1.5 赛季，战场从狂野的加密货币转移到了更为老练的美股市场。为了增加难度，主办方还设计了四种变态模式，包括不仅要赚钱还要极度克制的「苦行僧模式」，以及允许查看对手底牌的「情境感知模式」。

一场单方面的屠杀

比赛结果出来时，数据尴尬得让人想替其他大厂找个地缝钻进去。当 OpenAI 的 GPT-5.1 还在犹豫不决（剩下 9737 美元）时；当谷歌的 Gemini 3.0 Pro 因为操作失误巨亏近 30%（剩下 7382 美元）时；Grok 4.20 却像个老练的华尔街赌徒，冷静地收割着利润。

最讽刺的是上一代 Grok 4 也参赛了，结果垫底，亏得只剩 4610 美元。这恰恰证明了 xAI 在版本迭代上的惊人飞跃 —— 从「韭菜」进化成「镰刀」，马斯克只用了一个版本号。

它凭什么赢？

Grok 4.20 的胜出，或许早已注定。有分析指出，与其他只能通过普通联网搜索新闻的模型不同，Grok 拥有一个核武器级别的优势：它可以实时访问 X 的完整数据流。

在股市里，情绪就是金钱。当其他 AI 还在啃枯燥的财报时，Grok 可能已经通过分析推特上的数百万条推文，嗅到了散户对 Palantir (PLTR) 公司股票的狂热。

事实也证明了这一点。在比赛的「苦行僧模式」中，Grok 4.20 极其嚣张地对 PLTR 开了 10 倍杠杆。理由？它捕捉到了「AI 叙事」的宏观利好。这笔交易直接为它带来了 465 美元的浮盈。

而在另一个战场，它稳稳拿住了微软 (MSFT) 和代号 XYZ100 的仓位，即使市场震荡也纹丝不动，展现出了惊人的定力。

更可怕的是在「情境感知模式」下，Grok 4.20 一度拿下了近 50% 的收益。这个模式允许选手看到对手的持仓。Grok 不仅读懂了市场，还读懂了对手。它预判了 GPT 的预判，这才是最令人细思极恐的地方。

马斯克揭晓谜底

胜利之后，马斯克自然不会放过这个炫耀的机会。他在 X 上得意地确认了 Grok 4.20 的身份。

如果一个 4.20 版本已经能把其他顶尖 AI 杀得片甲不留，那么那个传说中的 Grok 5 会是什么？一个能操纵市场的超级怪兽？

Alpha Arena 的这场比赛给所有人都上了一课。对于华尔街的基金经理们来说，那个曾经被轻视的 AI，现在正盯着他们的饭碗。它不需要睡觉，没有恐惧，而且它比任何人都更早知道你在 X 上骂了哪家公司。当算法学会了贪婪，它收割世界的方式，甚至不需要流一滴血。

参考资料：

本文来自微信公众号：新智元（ID：AI_era）

]article_adlist–>

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>