Grok预测英超亏光10万英镑，AI投注跑输人类

                <!-- 相关专题top end-->
                            <!-- 期货推广begin -->

        <!-- 期货推广end -->

        <!-- 秒拍begin -->

        <!-- 秒拍end -->

        <!-- 视频播放器start -->

        <!-- 视频播放器end -->

        <!-- 行情图begin -->

        <!-- 行情图end -->

                <blockquote><p>　　炒股就看<a href="https://finance.sina.com.cn/stock/reportch/jinqilin.shtml" target="_blank">金麒麟分析师研报</a>，权威，专业，及时，全面，助您挖掘潜力主题机会！</p></blockquote>      <p>　　4月13日消息，据《金融时报》报道，人工智能初创公司General Reasoning发布的一项研究显示，X平台的聊天<span id="stock_sz300024"><a href="https://finance.sina.com.cn/realstock/company/sz300024/nc.shtml" class="keyword" target="_blank" data-sudaclick="content_marketkeywords_p">机器人</a></span>

Grok在预测体育赛事结果方面表现糟糕，明显落后于其他主流大语言模型。

　　该研究测试了八个主流LLM对2023-24赛季英超联赛的预测和投注能力。研究人员向这些模型输入了各支球队及历史比赛的详细数据，要求它们建立模型以最大化回报并管理风险。每个模型获得三次模拟机会和13.3万美元（10万英镑）的初始资金。

　　结果显示，Anthropic的Claude Opus 4.6表现最佳，三次尝试平均亏损11%，最终平均剩余资金为8.9万英镑。相比之下，X平台的Grok在第一次尝试中便亏光所有资金，后两次尝试未能完成任务，最终平均资金归零。OpenAI的GPT-5.4平均亏损13.6%，最终平均剩余11.6万美元（约8.64万英镑）。谷歌的Gemini 3.1 Pro整体表现最差但波动极大，平均亏损43.3%，但最佳一次尝试回报率达33.7%。

　　研究报告指出，总体而言AI在此类测试中“系统性跑输人类”。General Reasoning首席执行官Ross Taylor表示，尽管AI自动化备受追捧，但目前“缺乏将AI置于长期预测场景中的实测”，当前测试多发生在“静态环境”，无法反映现实世界的复杂性。

　　值得关注的是，就在Grok展现出不稳定的预测能力之际，其母公司xAI的所有者埃隆·马斯克据称正强制要求参与SpaceX即将IPO的银行订阅该工具，这可能推动Grok获得更广泛的企业级应用。（鞭牛士、AI普瑞斯编译）

相关推荐

近期文章