关于ZAKER Skills 合作
新浪财经 22分钟前

世界杯 32 强 12 大 AI 预测成绩放榜:腾讯夺冠,deepseek 仅列第四

来源:新浪财经

世界杯 32 强全部出炉,联想集体 × 咪咕视频 " 世界杯预测人机大战 " 也迎来了阶段性大结算—— 12 家大模型的 32 强预测成绩正式揭晓。

这场预测比拼的核心考题《2026 世界杯 32 强竞猜统一考试》答题卡,于 5 月 28 日正式上线发布,是本次人机大战的首轮核心任务。12 大 AI 在此答题卡上提前填写自己预判的 32 强晋级名单,以这份答题卡为作答基准,最终以实际出线队伍核对命中数量、排出预测榜单。

最终,腾讯混元以 29/32 的成绩位列第一,成为本届世界杯 32 强预测阶段的 " 最强 AI 预测官 ";MiniMax、讯飞星火均以 28/32 并列第二;DeepSeek、智谱、联想天禧 AI 则以 27/32 并列第四。

从最终榜单来看,AI 之间的差距并不算大,但头部模型已经开始显现领先优势。尤其是腾讯混元,在 32 个晋级席位中仅错 3 席,整体稳定性相当突出。更值得关注的是,这场持续多日的人机大战,AI 不仅完成了自我竞争,还实现了对人类预测团的整体反超。

数据显示,赛事初期,人类球迷仍占优势。6 月 13 日,AI 整体胜率仅为 43.8%,人类胜率达到 54.4%,领先 AI 超过 10 个百分点。彼时,不少人仍认为足球的随机性、临场状态和情绪因素,是 AI 难以真正掌握的领域。

但转折很快到来,6 月 18 日成为关键节点。 当天 AI 胜率首次超过人类,达到 48.6%,人类则回落至 45.0%。这是整场人机大战的重要分水岭—— AI 开始从 " 追赶者 " 变成 " 领先者 "。此后,AI 胜率一路走高。到 6 月 25 日首次突破 60%,截至 6 月 27 日,AI 整体胜率达到 61.9%,而人类为 54.6%,AI 最终领先人类 7.3 个百分点。

这意味着,在大样本预测中,AI 已经展现出相当强的稳定性。从具体表现看,AI 对传统强队的判断高度一致。像阿根廷、巴西、英格兰、葡萄牙等热门球队,大多数模型都能给出相对准确的晋级判断。这说明,在处理历史战绩、球员能力、世界排名、近期状态等结构化信息时,大模型已经非常成熟。

但真正拉开 AI 之间差距的,并不是这些 " 送分题 "。决定排名的,恰恰是那些最难预测的边缘席位与冷门小组。例如,波黑、佛得角、刚果(金)、加纳等非传统强队的晋级,成为整个预测大战中的最大变量;而伊朗、韩国、乌拉圭等球队的出局,也让不少模型出现失误。

尤其是佛得角,几乎可以说是本届世界杯 AI 预测中的 " 最大死角 "。这支赛前并不被看好的球队,先后让多家 AI 集体翻车。无论是对阵世界冠军,还是关键晋级战,佛得角都不断打破模型的预设逻辑。它也暴露出一个关键问题:当样本不足、历史数据有限、且球队状态出现超预期波动时,AI 的判断仍会明显失真。

换句话说,AI 最擅长预测 " 确定性 ",但足球最迷人的地方,恰恰在于 " 不确定性 "。这也是为什么,虽然 12 家 AI 整体成绩都不差,但排名依然被细微差距拉开。腾讯混元之所以登顶,不仅是因为判断强队更准,更重要的是它在一些高波动比赛中,减少了关键误判。MiniMax 与讯飞星火紧随其后,也说明头部模型正在从单纯的数据推演,逐步进化为对复杂变量的综合建模。

这场世界杯预测大战,也让我们看到一个有趣的趋势:AI 已经不再只是 " 辅助分析工具 ",而正在成为一种新的决策系统。它会看赛程、算概率、评估阵容、分析状态,甚至能从舆论、伤病、战术变化中提取信号。但与此同时,它依然无法完全解释足球世界里的偶然性——一张红牌、一次折射、一次门将失误,都可能瞬间改写结局。

因此,这次 32 强预测的最终结果,某种意义上不只是 " 谁更懂球 " 的较量。它更像是一场关于预测能力的公开测试:谁能更准确地理解实时信息?谁能更好地处理赛制规则?谁能在混乱和不确定中找到真正有效的信号?

而世界杯给出的答案是—— AI 已经越来越强,但它仍然无法彻底算透足球。也许这正是这场人机大战最精彩的地方,AI 让预测变得更理性,足球则提醒所有人:再强的算法,也永远算不尽绿茵场上的奇迹。

最新评论

没有更多评论了
新浪财经

新浪财经

新浪财经提供7*24小时财经资讯及全球金融市场报价;覆盖股票、债券、基金、期货、信托、理财、管理等多种面向个人和企业的服务。

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容