Grok预测英超亏光10万英镑,AI投注跑输人类 grok预测 grok预测major
创始人
2026-04-13 09:08:55

4月13日消息,据《金融时报》报道,人工智能初创公司General Reasoning发布的一项研究显示,X平台的聊天机器人Grok在预测体育赛事结果方面表现糟糕,明显落后于其他主流大语言模型。

该研究测试了八个主流LLM对2023-24赛季英超联赛的预测和投注能力。研究人员向这些模型输入了各支球队及历史比赛的详细数据,要求它们建立模型以最大化回报并管理风险。每个模型获得三次模拟机会和13.3万美元(10万英镑)的初始资金。

结果显示,Anthropic的Claude Opus 4.6表现最佳,三次尝试平均亏损11%,最终平均剩余资金为8.9万英镑。相比之下,X平台的Grok在第一次尝试中便亏光所有资金,后两次尝试未能完成任务,最终平均资金归零。OpenAI的GPT-5.4平均亏损13.6%,最终平均剩余11.6万美元(约8.64万英镑)。谷歌的Gemini 3.1 Pro整体表现最差但波动极大,平均亏损43.3%,但最佳一次尝试回报率达33.7%。

研究报告指出,总体而言AI在此类测试中"系统性跑输人类"。General Reasoning首席执行官Ross Taylor表示,尽管AI自动化备受追捧,但目前"缺乏将AI置于长期预测场景中的实测",当前测试多发生在"静态环境",无法反映现实世界的复杂性。

值得关注的是,就在Grok展现出不稳定的预测能力之际,其母公司xAI的所有者埃隆·马斯克据称正强制要求参与SpaceX即将IPO的银行订阅该工具,这可能推动Grok获得更广泛的企业级应用。(鞭牛士、AI普瑞斯编译)

相关内容

热门资讯

“软件+硬件”协同赋能国产汽车... 本文来源:时代商业研究院 作者:曹杨在新能源汽车智能化浪潮席卷之下,高端车载SOC芯片已成为国产芯片...
业绩股价“双杀” 昊海生科困局... 曾在医美、眼科、骨科三大领域风光无限的昊海生科,如今正面临不小挑战。近期,昊海生科交出一份营收、净利...
破圈“IP+”!第四届“文创上... 本文转载自公众号上海服装集团。2026年3月20日,由上海市文创办主办的第四届“文创上海”创新创业大...
国家航天局召开商业航天高质量发... 4月21日,工业和信息化部党组成员、副部长,国家航天局局长单忠德主持召开商业航天高质量发展企业圆桌会...
周一,A股,两大好消息! 周一... 4月27日,三大指数涨跌不一,创业板指走势较弱,科创50指数高开高走涨超3.5%。截至收盘,沪指涨0...