IT之家 9 月 20 日消息,埃隆・马斯克(Elon Musk)旗下 xAI 公司今天(9 月 20 日)推出全新 AI 模型 Grok 4 Fast,在企业与消费级任务中实现接近 Grok 4 的推理表现,同时平均减少 40% 推理 tokens。
在性能测试中,Grok 4 Fast 的推理基准表现与 Grok 4 相当,但平均使用的推理 tokens 减少了 40%,价格降低 98%。

例如,在 AIME 2025 无工具测试中,其正确率达 92.0%,超越 Grok 3 Mini,并在 HMMT 2025 等数学推理任务中取得显著优势。


在搜索与信息获取能力上,Grok 4 Fast 展现出前沿的多跳搜索(multihop search)表现。在 LMArena 搜索竞技场中,grok-4-fast-search 以 1163 Elo 分数排名第一,领先第二名 17 分;在中文搜索、跨平台数据整合等任务中,其准确率明显高于同类模型。

在 LMArena 的 Text Arena 中,grok-4-fast (代号: tahoe )排名第 8 ,性能与 grok-4-0709 相当,凸显了其卓越的智能密度。值得注意的是,所有同等大小的模型都排在第 18 位或更靠后。

架构方面,Grok 4 Fast 首次将长链推理模式与快速响应模式统一到同一模型中,并通过系统提示动态切换。这不仅减少了延迟,也进一步降低了 Token 成本,适用于实时搜索、代码执行等多种场景。开发者可通过 xAI API 调整推理深度以匹配不同需求。
Grok 4 Fast 目前已对所有用户(包括免费用户)开放,并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供。


在 API 调用方面,每 100 万 tokens 输入费用为 0.20 美元(IT之家注:现汇率约合 1.4 元人民币)起,每 100 万 tokens 输出费用为 0.50 美元(现汇率约合 3.6 元人民币)起。

