关于ZAKER Skills 合作
星途科讯 9小时前

苹果 Siri 重构:算力外包谷歌英伟达,年付十亿

苹果全球开发者大会(WWDC)定于 6 月 8 日开幕,其人工智能重构计划中最具深远影响的细节,竟涉及苹果并不拥有的硬件。据悉,基于 Gemini 重建的 Siri 将把最复杂的请求发送至谷歌云,由英伟达 Blackwell B200 图形处理器进行处理,而非运行在苹果自有服务器上。对于约 20 亿台苹果设备的庞大装机量而言,这意味着 iPhone 智能的核心部分,很快将在两大竞争对手构建的基础设施上运行。

打破全栈闭环:复杂查询路由至英伟达 B200

预计苹果将继续让设置计时器或控制智能家居等简单请求在 iPhone 本地运行。这一转变主要针对超出设备处理能力的复杂场景:相关查询将回退至谷歌的大型 Gemini 模型,并在谷歌部署的英伟达 Blackwell B200 芯片集群上完成处理,用户数据将在硅片层面进行加密。这一安排使谷歌和英伟达成为苹果多年来最重要产品的核心环节。

此举打破了苹果长期掌控全栈技术的惯例。该公司多年主张安全的软件必须建立在自行设计的硬件之上,并为此构建了 " 私有云计算 "(Private Cloud Compute)。将旗舰助手的推理能力外包给竞争对手的数据中心,直接背离了这一理念。

性能瓶颈迫使转向:私有云难以承载万亿参数

这一变化的主因是性能问题。据报道,苹果曾尝试在私有云计算中运行 Gemini 模型,但测试显示系统速度过慢,无法达到 Siri 所需的大规模可用性标准。这促使苹果转向谷歌现有的基础设施,后者已为万亿参数推理做好了资源准备。

这一细节修正了此前关于新 Siri 工作原理的认知。去年 11 月,外界普遍预期定制版 Gemini 模型将独家运行在苹果自有服务器上。而最新迹象表明计划已变,目前尚不清楚私有云计算在此次发布中究竟扮演何种角色。

隐私新防线:英伟达机密计算技术

隐私机制是此事的工程核心。Blackwell B200 是一款多芯粒数据中心处理器,集成 2080 亿个晶体管,专为服务万亿参数模型设计。苹果所依赖的是英伟达机密计算(Confidential Computing),这是一种从 CPU 扩展至 GPU 的基于硬件的可信执行环境。

当该模式激活时,Blackwell 芯片会对 GPU 内存中的所有数据(包括模型权重、用户输入和推理结果)进行加密,同时在计算过程中保持加密状态。在多 GPU 配置中,芯片间的 NVLink 流量也会被加密。B200 是首款在输入和输出路径上都提供可信执行保护的 GPU。

对读者而言,其实际意义非常具体:苹果押注即使请求在竞争对手机器上处理,片上加密也能确保 Siri 请求的机密性,避免数据以明文形式暴露给谷歌云端。这与苹果最初 " 无状态服务器、不保留任何数据 " 的私有云设计理念截然不同,新方法通过硬件在每一步保持提示词加密,并结合密码学证明验证芯片身份。

资金流向逆转:苹果年付 10 亿美元授权费

在英伟达硬件之上,是苹果与谷歌于 2026 年 1 月 12 日宣布的合作关系。苹果同意每年支付约 10 亿美元,授权一款定制的 1.2 万亿参数 Gemini 模型。该系统大小约为苹果自身 1500 亿参数云模型的八倍,远超设备上运行的约 30 亿参数模型。

这种经济模式颠覆了熟悉的关系格局。谷歌每年已向苹果支付约 200 亿美元以保持 Safari 默认搜索引擎地位,而在 Gemini 协议下,资金流向发生逆转,苹果需为其助手背后的智能层向谷歌付费。

反垄断阴影下的合作

这种日益紧密的关系落入了充满争议的法律环境中。美国司法部于 2026 年 2 月提起反垄断上诉,挑战了维持 200 亿美元搜索默认协议有效的裁决。法律分析人士指出,Gemini-Siri 协议引发了政府在搜索案中识别出的相同结构性担忧,因为它将 20 亿台设备的复杂 AI 查询路由至单一主导提供商。

谷歌方面表示,通过该协议不会接收苹果用户数据,且据报道合同禁止谷歌利用 Siri 查询训练其模型。若上诉成功,该合作关系可能面临两家公司均未公开讨论的限制条件。

发布时间表:9 月正式亮相

任何期待在周一看到成品助手的用户可能需要等待更久。WWDC 将是苹果预览 iOS 27 及其配套操作系统的场合,随后将推出开发者测试版。据报道,具备完整对话功能的 Gemini 驱动 Siri 将与下一代 iPhone 一同在 9 月发布。周一只是正式揭幕和开发者接入的开始,而非消费者发布日期。

常见问题解答

Siri 是否在使用 Google Gemini?

是的。根据 2026 年 1 月宣布的合作协议,重建后的 Siri 基于苹果从谷歌授权的定制 Gemini 模型。苹果自身的较小模型仍负责处理简单的设备端请求。

新版 Siri 何时推出?

据报道,Gemini 驱动的 Siri 将于 2026 年 9 月与下一代 iPhone 一同发布,而非在 6 月 8 日的 WWDC 主题演讲上亮相。预计 WWDC 将率先预览该软件并向开发者开放。

苹果会与谷歌共享 Siri 数据吗?

谷歌表示不会通过该交易接收苹果用户数据,且苹果正依靠英伟达机密计算在处理过程中对请求进行加密。据报道,合同防止谷歌利用 Siri 查询训练其模型。

什么是英伟达 B200?

Blackwell B200 是英伟达的旗舰数据中心 GPU,专为大规模 AI 训练和万亿参数推理而设计。它包含硬件机密计算功能,可在芯片处理数据时对数据进行加密。

【星途科讯 图文丨欧阳布布】

相关标签

相关阅读

最新评论

没有更多评论了
星途科讯

星途科讯

解码海外,科技新知

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容