关于ZAKER Skills 合作
新浪财经 21小时前

“亚洲希望”澳大利亚点球出局, 12 家 AI “三派对决”:6 家押平,5 家直接命中 1:1

来源:新浪财经

如果说过去几轮世界杯,人们讨论最多的是 AI 会不会 " 集体翻车 ",那么澳大利亚与埃及这场比赛,则呈现出另一种完全不同的画风,AI 没有形成共识。

北京时间 7 月 4 日凌晨 2 点,澳大利亚与埃及战成 1:1。赛前,在联想集团 × 咪咕视频《世界杯预测人机大战》中,12 家大模型并没有像以往那样集体押向一边,而是出现了本届赛事最明显的一次 " 意见分裂 "。

最终,12 家 AI 形成了三个阵营:2 家支持澳大利亚取胜;4 家支持埃及取胜;6 家认为双方将在 90 分钟内战平。这意味着,平局第一次成为 AI 阵营中的主流观点,比赛结束后回看,这 6 家坚持平局判断的大模型,成为本场比赛最大的赢家。其中,通义千问、Kimi、智谱、MiniMax、阶跃五家模型不仅猜中了平局方向,更直接命中了 1:1 的准确比分。中移九天虽然预测的是 0:0,但同样命中了平局结果。

最终,AI 阵营取得了 6 家命中胜平负,5 家命中准确比分。这是本届世界杯 AI 预测中少见的一次 " 高质量平局预测 "。

相比之下,人类嘉宾阵营则出现了明显分化。颜强、韩乔生都预测埃及 1:2 取胜;阎鹤祥则看好澳大利亚 2:1 获胜;只有张路和苏东坚持战平。其中,张路直接命中 1:1 比分,苏东预测 0:0,同样判断正确了比赛方向。最终,5 位嘉宾中有 2 位猜中平局,其中 1 位命中准确比分。

如果单纯比较胜平负,这场比赛 AI 与人类都没有出现压倒性优势,但真正值得关注的是另一件事。过去的世界杯预测中,大模型越来越容易形成 " 共识 "。面对强弱分明的比赛,12 家模型往往会给出高度一致的判断;即便出现冷门,也常常表现为 " 集体翻车 "。而澳大利亚与埃及这场比赛,却完全不同,模型之间出现了明显分歧。有人相信澳大利亚的整体实力;有人更看好埃及的反击效率;也有人认为双方实力接近,平局概率最高。

最终,没有共识,反而更接近真相。从某种意义上说,这也说明,大模型的预测能力正在进入新的阶段。它们不再只是简单输出相似答案,而是在面对势均力敌的比赛时,开始根据各自的数据体系、权重模型和推理逻辑,得出不同结论。而这种差异,恰恰也是 AI 预测越来越有意思的地方,它不只是告诉你谁会赢,更是在展示不同模型究竟是如何理解一场足球比赛。

对于本届世界杯来说,这场 1:1 也留下了一个很有意思的纪录:第一次,不是 AI 集体猜对,而是 AI 先 " 吵 " 出了三个答案,最后平局派赢了。

本文为 " 世界杯预测人机大战 " 每日战报,由新浪财经联合联想集团、咪咕视频共同呈现。活动详情请关注咪咕视频 APP。每晚 9 点,联想集团与咪咕视频联合出品的《人机大战:谁是世界杯预言家》在咪咕视频热播,敬请观看!

相关阅读

最新评论

没有更多评论了
新浪财经

新浪财经

新浪财经提供7*24小时财经资讯及全球金融市场报价;覆盖股票、债券、基金、期货、信托、理财、管理等多种面向个人和企业的服务。

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容