财联社 4 月 23 日讯(编辑 史正丞)当地时间周三,美国云服务巨头谷歌云举行 2026 Next 大会,发布了旨在推动企业工作流程全面转向智能体的 " 代理式企业 "(Agentic Enterprise)技术栈,涵盖第八代 TPU、智能体软件平台等一系列前沿创新。
发布会伊始,谷歌 CEO 皮查伊在一段预录的视频中重申了资本开支的巨额增长,称今年将投入 1750 亿 -1850 亿美元,较 2022 年的 310 亿美元翻了近 6 倍。
皮查伊也表示,谷歌已经进入了所谓的 " 智能体工作流程 "。截至 4 月,这家科技巨头已经有 75% 的新增代码由 AI 生成(并由工程师审阅批准),较去年秋天的 50% 显著上升。

在 Vertex AI 平台的基础之上,谷歌云周三推出 Gemini Enterprise 代理平台,这是专为建立、扩充、治理和优化 AI 代理所打造的全方位平台。该平台整合了原有的模型选择、模型建立和 AI 代理建立功能,并加入代理整合、开发运作、调度和安全等新功能。
最受资本市场关注的张量处理单元(TPU)紧接着亮相。据财联社周三早些时候报道,谷歌的第八代 TPU 正式拆分成两款不同的芯片,分别是针对 AI 模型训练的TPU 8t和更适合推理任务的TPU 8i。


除了原始算力外,TPU 8t 还有一整套可靠性、可用性与可维护性(RAS)能力的设计,包括覆盖数万枚芯片的实时遥测监控、在不中断任务运行的情况下自动检测并绕过故障的 ICI 互联链路,以及能够在无需人工干预的前提下围绕故障自动重构硬件拓扑结构的光路电路交换(OCS)技术。
整体而言,TPU 8t 阵列的计算性能较上一代 Ironwood 几乎提升了 3 倍,每瓦性能提升至最多两倍。
TPU 8i 则是谷歌 " 打破内存墙 " 的作品。为避免处理器处于空闲等待状态,TPU 8i 配备了 288GB 高带宽内存(HBM)和 384MB 片上 SRAM——后者是上一代的 3 倍,从而使模型的活跃工作集能够完全保留在芯片内部运行。
" 内存墙 " 指的是芯片无法足够快地访问数据时形成的瓶颈,迫使用户等待更长的响应时间。
TPU 8i 采用分层式 Boardfly 网络拓扑结构:其基础构建单元由 4 枚完全互联的芯片组成,进一步扩展形成由 8 块板卡(通过铜缆)构成的本地化组;而 36 个这样的组再通过 OCS 互联成一个 TPU 8i 集群。在这样的结构下,任意两枚芯片之间的通信最多只需经过 7 次跳转。

谷歌云同时透露,TPU 8t、TPU 8i 均运行在公司自研的 Axion ARM CPU 平台上,由公司第四代液冷技术支持。

硬件升级之后,软件应用层面也紧跟着迎来 AI 时代的创新。
谷歌云在周三推出面向 AI 代理的数据库 " 知识目录 "(Knowledge Catalog)。
公司介绍称,传统的数据目录是为开发者手工浏览设计,关注表结构而非 AI 代理所需的深层业务语义。当 AI 缺乏业务语义和数据关系时,就会导致幻觉、高延迟和过时的洞见。" 知识目录 " 原生集成 Gemini,能够识别有用的业务信息并自动构建流水线,从非结构化内容中提取实体并映射复杂的业务关系。
同时通过谷歌云的 " 智能存储 "(Smart Storage)功能,在数据上传到云端的那一刻,就会被自动添加标签、生成嵌入向量并丰富元数据。通过 " 智能存储 " 与 " 知识目录 " 相结合,智能代理能够即时找到非结构化数据。
在数据端,谷歌云推出跨云湖仓(Cross-Cloud Lakehouse),智能体可以像在本地谷歌云上一样使用存储在亚马逊 AWS、微软 Azure 等外部云服务商的数据,实现无缝的跨云访问。
基于上述更新,谷歌云推出了面向企业洞察的深度研究代理。基于对所有结构化和非结构化数据的充分掌握,现在谷歌的数据智能体可以回答诸如 " 导致我供应链中断的根本原因是什么?" 或 " 你能对该地区进行财务审计吗?" 等复杂的业务问题,并提供此前需要消耗 " 数周人力 " 才能实现的精确度。
谷歌云也在周三更新了有关云安全方面的进展。随着公司上个月完成对云端与安全平台公司 Wiz 的 320 亿美元巨额收购,谷歌云顺势推出 " 谷歌云反诈防御平台 ",旨在识别机器人、真人与代理的合法性与授权状况。


