关于ZAKER Skills 合作
钛媒体 24分钟前

英伟达 GTC 2026:智能体 AI 时代,全栈战略正式落地

北京时间 2026 年 6 月 1 日,英伟达创始人兼 CEO 黄仁勋在中国台北发表了 GTC 2026 重磅主题演讲。

他明确指出,两年前播下的生成式 AI 种子已然结出硕果—— " 有用的人工智能 " 已经到来,其核心标志便是智能体 AI(Agentic AI)的全面爆发。在这场演说中,黄仁勋不仅展示了专为智能体量产的超强硬件集群,更重新定义了从芯片、基础设施到个人电脑的整个计算生态。

这场演讲不是产品发布会,而是一次系统性的范式宣言:AI 从 " 能用 " 到 " 有用 ",从 " 生成内容 " 到 " 完成工作 ",从 GPU 公司到 AI 基础设施公司,英伟达正在完成一次深刻的自我重构。

智能体推动 AI 进入商业化闭环

黄仁勋开篇即给出颠覆性的行业判断:大语言模型(LLM)正加速演进为具备理解、观察、推理和规划能力的 " 智能体系统 "。针对 "AI 减少就业 " 的论调,他直言 " 完全是一派胡言 "。

GitHub 代码提交量从 2023 年的 3 亿次逐年攀升,到 2026 年初已接近三倍,达约 9 亿次。这背后的商业底层逻辑是:同样 3 万亿美元的工程师薪酬投入,在智能体的放大下,现在能产出接近 9 万亿美元的生产力价值。AI 不是在抢工作,而是在指数级放大每个工程师的产出。当计算本身成为高产出的经济单位,Tokens 的生产随之盈利,这直接推动了全球对 AI 工厂算力需求的爆发式增长。

Vera Rubin 全面量产:专为智能体而造的超级计算机

本场演讲最重磅的硬件消息,是 Vera Rubin 架构正式进入全面量产。这是英伟达史上最复杂的端到端机架级集群系统:集成了 Rubin GPU(NVL72)、自研 Vera CPU、ConnectX-9 网络、BlueField-4 安全处理器,以及全球首款 200Gb CPO(光电共封装)光学以太网 Spectrum-X 交换机。其供应链规模是 Grace Blackwell 的两倍,得益于创新的无缆化 midplane 设计,单机架组装时间从 2 小时大幅压缩至 5 分钟。

Vera CPU:英伟达杀入 CPU 市场的战略铁拳

英伟达推出了专为 AI 智能体打造的自研 Vera CPU,基于全新的 Olympus 核心架构,这无疑是整场演讲中最具战略意味的发布。黄仁勋指出:" 未来智能体的数量将远超人类,且它们调用工具、访问数据库时对延迟极度没有耐心。为‘人类’设计的传统 CPU 天然不适配纳秒级的异构计算,这是一个被英伟达凭空创造出的全新巨大市场。"

在真实工作负载中,Vera CPU 凭借消除了 Chiplet 损耗的单体网格互联(3.6 TB/s 核心带宽)与强悍的单线程 IPC 性能,让 SQL 数据库处理提速 3 倍,在纽约证券交易所的实时流处理任务中更是狂飙 6 倍,直接打破了传统处理器的性能天花板。

开源工具包与 5 倍速 Nemotron-3 Ultra:降低企业智能体门槛

为了让全球企业能像组装软件一样安全、定制化地部署智能体,NVIDIA 推出智能体企业 AI 工具包(Agentic Toolkit for Enterprise AI),包含开源的 OpenShell 安全沙盒及编排框架。

黄仁勋现场展示了与 Cadence(楷登电子)联合打造的芯片设计超级智能体,通过自动化 RTL 验证与调试,将原本数周的迭代周期缩短至数小时,效率暴增 40 倍。作为该生态的底层基石,NVIDIA 正式发布了 Nemotron-3 Ultra 开源模型。该模型基于全新的 SSM(状态空间模型)与 MoE(混合专家模型)混合架构,推理速度提升 5 倍,总成本降低 30%,且全盘开源了训练脚本与工具调用数据集,联合 CrowdStrike、Palantir、SAP 和 ServiceNow 等巨头共同做大企业智能体生态。

40 年来首次重新定义 PC

在端侧,NVIDIA 联手微软共同重构了历经 40 年演进的个人电脑生态,推出全新 RTX Spark 智能体计算平台

其核心驱动力源于英伟达与联发科(MediaTek)联合研发的 N1X 芯片:集成 Blackwell 架构 GPU(提供 1 PetaFLOP 算力)、20 核定制 Grace CPU 以及 128GB 统一内存,采用台积电 3nm 工艺。

演讲现场演示了一个颇具冲击力的场景:在 RTX Spark 笔记本上本地运行智能体,通过集成的 MCP(模型上下文协议)服务器直接与本地软件交互,并连接云端 Claude Sonnet,完成了从概念草图到 3D 建筑效果图的全流程设计。智能体自主调用 Rhino、Blender 和 Flux 2 协作完成,全程自动纠错,无需人工干预。

新 PC 产品线覆盖笔记本、台式机和 DGX Station 三种形态(后者配备 768GB 内存,可在桌面端运行万亿参数模型)。黄仁勋预判:十年后,家庭 AI 超级计算机将像现代家电一样普及,这场 PC 再发明与智能手机的诞生同等量级。

物理 AI:Cosmos 3 与具身智能

演讲的尾声聚焦于物理 AI 与具身智能。黄仁勋认为物理 AI 的致命痛点在于第一人称维度的机器视角数据极度匮乏,对此 NVIDIA 祭出核心武器——Cosmos 3 开源前沿世界模型

Cosmos 3 融合了自回归与扩散 Transformer 架构,能将像素、动作、声音和语言统一处理,直接通过计算生成完全符合真实物理规律的合成视频,成为机器人的 " 虚拟导师 "。基于此,NVIDIA 发布了具备自言自语思考能力的推理级自动驾驶模型 Alphamayo,以及高度集成的 Isaac GR00T 人形机器人参考开发平台。该机器人具备 31 个自由度(包含 25 自由度灵巧手),由 Jetson Thor 芯片驱动,全套软件栈在数小时内即可对全球科研机构开箱即用。

核心信号

回顾整场演讲,黄仁勋反复强调一个核心逻辑:算力即营收,每瓦 Token 数即利润率。英伟达的竞争壁垒,不再只是单一的 GPU 性能,而是从芯片到机架、从软件到运维、从云端到端侧 PC 的全栈整合与极端协同设计能力。

当单体 AI 工厂的建设造价正在迈向千亿美元量级,谁能帮客户更快投产、更高效运转、更长周期盈利,谁就赢得这个时代。黄仁勋在 Computex 传递的最核心信号只有一个:英伟达已经不再是一家单纯的 GPU 公司,而是智能体时代无可替代的基础设施垄断者。

黄仁勋 GTC 台北 2026 演讲全文

直播完整回放:https://weibo.com/2853016445/R24DtF3bi

开场致辞

很高兴见到大家,很高兴回到家乡。我把我的父母也带回来了——我的爸爸妈妈在哪里?请大家为我的父母鼓掌。也请为我们的开场表演鼓掌,中国台湾的超级明星们,看看他们多可爱。今天现场有这么多人,我们正在向中国台湾全岛 70 个观看派对同步直播,70 场同步举办的大会正在收看这场主题演讲。

我们今天有太多内容要分享,也有太多合作伙伴要感谢。中国台湾的生态系统已经变得无比庞大,令人惊叹。通常人们谈到生态系统,会想到我们的软件技术栈,想到英伟达(NVIDIA)构建的计算系统之上的开发者生态系统。但英伟达的生态系统向上游延伸,覆盖中国台湾全体供应链合作伙伴;向下游延伸,一直到数据中心,直至终端用户。今天我们将介绍几乎整个生态系统。

今年,我们共同的业务正在以惊人的速度增长。事实上,昨晚有人告诉我,中国台湾今年的年度 GDP 将增长近 10%,令人叹为观止。我们要讲的内容很多,让我们开始吧。

第一部分:智能体 AI 时代的到来

两年前我站在这里,开始向大家介绍 AI 从生成式 AI 转向下一波浪潮的趋势。那下一波浪潮就是——智能体 AI(Agentic AI)。今天,我可以宣布:智能体 AI 已经到来,实用 AI 已经到来。

这意味着什么?我们来看 GitHub。软件编程是智能体 AI 最早落地的应用场景之一。全球有 3000 万至 4000 万名专业软件开发者,加上学生和爱好者,总体上数以亿计的人以写代码为生。GitHub 的 Commit(代码提交)数量就是最好的佐证:

2023 年:约 3 亿次 Commit

2024 年:约 4 亿次

2025 年:约 5 亿次

2026 年前几个月:数量已接近三倍增长

这意味着什么?全球 3000 万软件开发者,每年产生约 3 万亿美元的工资性 GDP,带动了约 100 万亿美元的全球产业增长。而现在,同样 3 万亿美元的工资,正在产生将近 3 倍的产出——相当于 9 万亿美元的生产力。

有人说 AI 会减少就业岗位,这完全是无稽之谈。AI 实际上正在促使更多软件工程师被雇用。道理很简单:如果雇用一名软件工程师就能创造 9 万亿美元的生产价值,谁会不想多雇人?这一趋势很快就会在我们的经济中显现出来。

第二部分:Token 经济与算力需求的爆发

实用 AI 的到来,从产业角度意味着什么?这意味着 Token(推理令牌)正处于前所未有的需求爆发期。AI 已成为利润来源,Token 已成为可变现的盈利单元。正因为 AI 已经可以盈利,AI 公司正争相生产更多 Token,建设更多 AI 工厂,这正是中国台湾算力需求急剧攀升的根本原因。

算力模式已经改变,一切都变了。AI 不再只是大语言模型,而是一个完整的智能体系统。今天我们要谈的几乎所有内容,都建立在这一基础之上。

第三部分:智能体架构解析

让我来详细解释智能体是什么。这是一个智能体应用。过去,系统架构是:应用程序→代码→操作系统。今天,它是一个智能体,由一个或多个大语言模型(LLM)嵌套在一个 " 框架(Harness)" 中构成,框架负责协调整个系统完成实际工作。

输入进来之后,智能体需要:观察(Observe)→推理(Reason)→行动(Act)→使用工具(Use Tools)。工具可以是电子表格、网络浏览器、数据处理引擎、数据库引擎等。这个框架负责协调所有信息流转。

智能体还具备短期工作记忆(Working Memory,即 KV 缓存)和长期记忆(Long-term Memory),就像人类一样。整套系统——大语言模型负责思考,框架连接一切,就像操作系统一样——这就是新的计算模型。

这也是一次重大突破:大语言模型在推理、规划、工具使用方面已达到相当水平,配合管理记忆与编排的框架,我们现在能做到令人叹为观止的事情。

第四部分:CUDA-X 库——智能体的工具宝库

很多人说,智能体 AI 的到来意味着所有软件公司都将被颠覆。我的判断恰恰相反:因为会有无数智能体,世界将不再受限于人的数量,这些智能体将使用比以往更多的工具。这是软件公司的绝佳时机,但前提是软件必须以智能体能够调用的方式提供。

英伟达的 CUDA-X 库正是这一宝库。20 年前,我们构建了 CUDA ——一个统一的加速计算架构,重新定义了计算;1000 多个 CUDA-X 库帮助开发者在每个科学和工程领域取得突破。这些库涵盖:

cuLitho(计算光刻)

cuOpt(决策优化)

cuDSS(稀疏直接求解器)

AIQ(结构化与非结构化文档的深度研究)

Aerial(AI-RAN,AI 驱动的无线接入网)

Warp(可微分物理仿真)

Parabricks(基因组学)

这些库的底层是精美的数学算法。未来,CUDA-X 库将以 " 技能包(Skills)" 形式提供给智能体,配备使用说明文档,供 AI 学习如何调用——其效果甚至将超越人类使用者。

第五部分:Vera Rubin ——为智能体时代而生的超级计算机

智能体系统是一种高度分散化、分布式的计算模型。正是这一架构需求,催生了 Vera Rubin 的完整设计。处理一次智能体调用,需要激活整套计算基础设施:

大语言模型负责思考(每次激活均需一整套 Vera Rubin NVL72 系统,采用 NVLink 72 互连技术)

工具调用使用 CPU(可能是 C 编译器、Python、JavaScript 或加速计算)

框架的编排与安全运行在 CPU 和 DPU(Bluefield)上

内存管理(KV 缓存的压缩、检索、知识图谱)极其复杂

智能体的内存系统,将彻底革新存储系统的形态。

Vera Rubin 不是一颗芯片,也不只是 GPU,而是一套完整的端到端系统,包含:Vera Rubin GPU(NVL72,采用 NVLink 72 互连)、Vera CPU、CX9 网络、全栈软件、Bluefield 安全处理器(支持静态、传输中和使用中的数据加密),整套系统遵循机密计算(Confidential Computing)标准,因为 AI 模型太珍贵了。

Vera Rubin 是英伟达历史上最宏大的工程壮举,全公司 40,000 名工程师以及在座的所有合作伙伴都参与其中。Vera Rubin 是一个奇迹——它由五个相互连接的机架级系统构成,涉及中国台湾 150 家供应链合作伙伴,数百万平方英尺的工厂地板,数百个生产点位。

我很高兴宣布:Vera Rubin 现已进入全面量产阶段!其供应链规模是 Grace Blackwell 的两倍,而一个机架的组装时间从原来的 2 小时缩短至仅需 5 分钟。

第六部分:DSX —— AI 工厂的蓝图

世界正在竞相建造 AI 工厂,这是人类历史上规模最大的基础设施建设浪潮。AI 工厂极其复杂,每一层——芯片、机架、网络、电力、冷却、电网——都必须从端到端整体设计。因为算力就是营收,英伟达 DSX(数据中心基础设施蓝图)正是 AI 工厂的标准参考设计。

DSX 主要包含:

DSX Sim(仿真):通过 Omniverse 蓝图,合作伙伴在第一台机架落地前,便可在数字孪生中完成 AI 工厂的设计、验证、模拟电力和冷却、网络规划;

DSX OS:工厂上电后自动接管,负责资源调配、运营监控与故障修复,将已安装系统转化为可信、多租户、高可用的 AI 就绪产能;

DSX MaxLPS:当前 AI 工厂普遍超额配置电力达 40%,DSX MaxLPS 允许在相同电力预算内部署更多 GPU,每年创造数十亿美元额外收益;支持 45 ℃热液冷却,节水节能;动态电力分配可在机架间实时调度,回收 " 搁浅瓦数 ";

DSX Flex:将 AI 工厂作为灵活储能资产,实时读取电网信号,在电网需要调峰时动态调整工厂用电。

到本十年末,将有 100 吉瓦的 AI 工厂上线。英伟达 DSX AI 工厂以最高效率运行、生产成本最低的 Token,同时使电网更加稳定。

第七部分:算力即营收—— AI 基础设施的经济学

英伟达已从 GPU 公司、系统公司,进化为 AI 础设施公司。值得注意的是,当前每座吉瓦级 AI 工厂的建设造价已从最初的 200 亿至 300 亿美元,攀升至 500 亿至 600 亿美元,并很快将达到 800 亿至 1000 亿美元。如此规模的资本投入,必须一次建成、立即运转,资本成本极高,容错空间极小。

为什么选择英伟达至关重要?原因在于四点:

第一,更短的投产时间(Time to First Token):我们将整套基础设施完整连接,自行建设,确保一切正常运行,因此客户能更快开始推理和训练。

第二,更高的每瓦 Token 数(Tokens per Watt):如果您的数据中心有 1 吉瓦的电力,就是 1 吉瓦,不会更多。在这个约束下,每瓦效能即营收。选择便宜但低效的架构并不合算——您需要确保每多买一台,就能多赚一分。

第三,超高的可靠性:大规模数据中心有数百万根线缆,极难保证系统协同稳定运行。英伟达长期运营超大规模系统,这一经验至关重要。

第四,更长的系统生命周期:过去数年间,从 CNN 到 Transformer,从 MoE(混合专家模型)到现在的智能体系统,AI 软件持续快速演进。如果架构缺乏灵活性,生态系统不够丰富,系统生命周期就会很短。英伟达生态系统已无处不在,软件开发者天然从 CUDA 起步,因此系统的有效资产寿命远长于其他方案,总拥有成本(TCO)大幅降低。

第八部分:Vera CPU ——为智能体而生的处理器

过去所有的 CPU 都是为人类而建,我们生活在以秒计时的世界里。但智能体是没有耐心的,它们活在以纳秒计时的世界里。智能体调用工具时,需要响应越快越好;访问数据库时,必须尽快返回结果——每一刻的等待,都阻碍着智能体进入下一步。

因此,我们为智能体时代打造了全新的 Vera CPU。其核心是英伟达自研的 Olympus 数据中心 CPU 核心架构,专为现代数据中心工作负载优化——包括分支密集的 Python 运行时、工具调用和沙箱代码执行。

Vera CPU 具备四大核心设计目标:

第一,极高的单线程性能(IPC):每时钟周期可获取、解码并执行 10 条指令,全球最高。智能体需要低延迟而非高吞吐量。

第二,超高的内核带宽:英伟达第二代可扩展一致性互联架构(Scalable Coherency Fabric),将 88 个 Olympus 内核通过整体网格连接,内核到内核通信速度比传统 CPU 快 50%;采用 NVLink 芯片到芯片互连,可将 GPU 直接接入内存一致性互联架构,还可多插槽扩展。

第三,惊人的系统带宽:LPDDR5X 内存,1.2 TB/s 带宽,相当于最高性能 x86 CPU 的 3 倍;率先支持 PCIe Gen6;支持多比特错误纠正同时不损失带宽,峰值内存延迟比 x86 低 40%。

第四,极致的能效:CPU 不能抢夺 GPU 生成 Token 所需的电力,必须在高性能的同时做到极度节能。

Vera 的基准测试结果令人震惊:

SQL 数据库查询:速度提升 3 倍

纽约证券交易所实时流处理:速度提升 6 倍

智能体沙箱性能:比 x86 CPU 高 1.8 倍

Vera 已与全球几乎所有主流 ODM 和服务器厂商合作,正在开辟一个全新市场。由于未来智能体数量将远超人类数量,且智能体极度没有耐心,这个市场的规模必将超过以往任何一代 CPU 市场。

第九部分:英伟达企业 AI 工具包——让每家企业都能构建智能体

每家公司都将成为智能体公司。我们为此打造了英伟达企业 AI 工具包(Nvidia Agent Toolkit for Enterprise AI),包含四个核心组件:

第一,模型(Models):英伟达开放的世界级模型,可直接使用或按需微调。也可运行来自任何供应商的智能体,包括 Claude Code(Anthropic)、Codex(OpenAI 旗下编程智能体)等。

第二,框架(Harness):Open Shell ——一个高安全性的企业级智能体框架(开源)。它为智能体提供安全沙箱保护、企业安全策略绑定、隐私保护、权限与身份管理。Red Hat、Canonical、微软等公司已纷纷采用,将在全球广泛普及。此外还有 Hermes ——另一款强大的智能体框架。

第三,工具与技能(Tools & Skills):CUDA-X 加速库,以及不断扩充的智能体专用技能包。

第四,运行时(Runtime):针对英伟达 AI 平台深度优化,可在任意云端、本地(On-Prem)乃至设备端运行。

很多人说,智能体会颠覆 SAP、ServiceNow、Palantir、CrowdStrike 这样的企业软件公司。我的判断恰恰相反——智能体将为这些公司创造有史以来最大的机遇。智能体需要工具,这些公司正是最好的工具提供者。

以 Cadence 合作为例:英伟达与 Cadence 联合打造了芯片设计超级智能体,以 Codex 或 Claude Code 为编排核心,以 RTL(寄存器传输级)代码和架构规格为输入,调用 Cadence Xcelium 进行 RTL 仿真验证,调用 Jasper 进行形式化验证,配合 Nemotron 模型在 Open Shell 安全环境中运行。结果:原本需要数周的验证周期,现在缩短至数小时,提速超过 40 倍。英伟达计划雇用成千上万个 Cadence 超级智能体,以加速自身的芯片研发。

第十部分:Nemotron 3 Ultra ——面向所有人的开放模型

要构建能力卓越的智能体,首先需要一个出色的基础模型。英伟达致力于为全世界构建开放模型,让所有人都能据此创建自己的智能体。今天,我们正式发布 Nemotron 3 Ultra。

Nemotron 3 Ultra 的特点:

完全开放:模型权重、训练数据、训练脚本全部公开;

全球首个基于 SSM(状态空间模型)与 MoE(混合专家模型)混合架构的模型;

推理速度提升 5 倍,推理总成本(含 FLOPs 与推理时间)降低 30%;

在推理能力与推理速度上同时领先全球最优秀的开放模型;

训练数据来自英伟达及合作伙伴联盟的高质量长文推理与工具调用数据集。

Nemotron 4 目前也在研发中,敬请期待。

第十一部分:重新定义 PC —— RTX Spark 与全新 PC 产品线

40 年前,PC 的出现改变了世界。现在,英伟达与微软共同历经 3 年,正式重新定义 PC。值得一提的是,明天黄仁勋将与微软 CEO 萨提亚 · 纳德拉(Satya Nadella)联合亮相,共同深入介绍双方合作成果。

新的 PC 操作系统,是旧操作系统加上大语言模型。大语言模型在很多方面是 DirectX 的现代版本:它理解输入输出、理解提示(Prompt)、支持计算机视觉、可生成视频与声音——它是计算机的智能延伸。在此之上,原有的应用程序将被智能体运行时(Agentic Runtime)所取代。

今天,我们发布 RTX Spark:

核心规格:

Blackwell RTX GPU,6144 个 CUDA 核心,1 PFLOP AI 算力

定制化 20 核 Grace CPU(与联发科合作研发,芯片代号 N1X)

NVLink 统一互连,128GB 统一内存

台积电 3nm 制程,700 亿晶体管

RTX Spark 演示场景:本地运行 Hermes 框架,连接云端 Claude Sonnet 模型,实现 AI 辅助建筑设计。智能体调用 Rhino 建模工具、Blender 渲染器、Flux 2 图像生成模型,将构思草图转化为专业 3D 效果图,全程自主纠错,实现 " 以想象力驱动设计 " 的全新工作流。

Adobe 已针对 RTX Spark 重构了 Photoshop 和 Premiere 的核心架构,速度提升 2 倍,并增加 MCP 服务器支持,实现与本地智能体的无缝交互。

完整新 PC 产品线(三大形态):

RTX Spark 笔记本电脑:全新设计,搭载 N1X 芯片(英伟达与联发科联合研发),100% 兼容英伟达完整软件栈;

RTX 台式机:可全天候运行本地 AI 智能体,7 × 24 小时在线,可连接家中所有设备;

DGX Station for Windows:768GB 内存,可运行万亿参数模型,20 PFLOPS 算力,8 TB/s 内存带宽,专为大模型开发者设计。

英伟达已建立新 PC 产品线的完整路线图:每一代架构都将对应桌面、笔记本和工作站三种形态。全球 PC 产业 100% 参与,共同开启 PC 的新纪元。这场再发明,与智能手机的诞生同等量级。

第十二部分:物理 AI —— Cosmos 3、自动驾驶与机器人系统

智能体 AI 也将遍布各类物理设备。其中,物理 AI 最难的问题是数据——绝大多数视频数据是第三人称视角,而机器人 AI 需要第一人称视角数据。英伟达通过遥操作示范、仿真强化学习、第三人称到第一人称的视角重投影,逐步建立起世界基础模型。

Cosmos 3 ——物理 AI 的基础模型

今天,我们发布 Cosmos 3,这是物理 AI 领域的前沿基础模型。Cosmos 采用全新的混合 Transformer 架构,像素、动作、声音和语言同时流入自回归 Transformer(负责推理与规划),并驱动扩散 Transformer(负责生成下一帧内容)。

Cosmos 可作为:VLM(视觉语言模型)观察并描述物理世界;世界模型生成物理精确的合成视频;仿真器实现闭环策略训练与评估;世界行动模型逐帧预测未来,生成各类机器人的动作指令。Cosmos 同样完全开放——模型、数据、训练方法全部公开。

在自动驾驶领域,今天我们还发布了面向自动驾驶汽车的开放推理模型 Alphamayo 2。约 80% 的全球汽车制造商已加入英伟达 Hyperion 平台,约 97% 的全球出行服务商也已接入。演示中,搭载该系统的梅赛德斯车辆可实时语音播报自身的推理过程与驾驶决策,这正是 AI" 思考中 " 的外化体现。

在人形机器人领域,Isaac Groot 平台包含模型、数据生成、仿真与运行时的完整技术栈。今天我们还发布了 Isaac Groot 参考机器人:由 Schaeffler 制造,25 个手部自由度,全身 31 个自由度;身高 6 英尺,体重 150 磅;搭载 Thor 处理器及英伟达完整软件栈;专为高校和研究机构设计,大幅降低人形机器人研究门槛。

总结与展望

过去 6 个月,一切都变了。智能体 AI 已经实现,并与最新的前沿模型融合,使 AI 真正能够完成实用工作。智能体这一计算模式——模型 + 框架 + 工具与技能 + 运行时——将在云端、本地、PC、机器人、卫星、基站、工厂中无处不在地运行。

今天的主要发布:

一、Vera Rubin 全面量产——为智能体时代而建的多机架集群级超级计算机,从 GPU(NVL72)、CPU、网络(Spectrum-X,全球首款集成 200Gb 共封装光学的以太网交换机)、存储到安全处理器(Bluefield 4),完整覆盖;

二、Vera CPU ——为智能体而生的全新架构处理器,单线程性能、带宽、能效全面领先,将成为英伟达历史上最快速成功的产品之一;

三、英伟达企业 AI 工具包——涵盖 Nemotron 3 Ultra 开放模型、Open Shell/Hermes 框架、CUDA-X 工具库、运行时,帮助每家企业构建属于自己的智能体;

四、RTX Spark 与全新 PC 产品线——与微软联合重新定义 PC,40 年来首次全面革新;

五、Cosmos 3 ——物理 AI 基础模型,完全开放;

六、面向自动驾驶的开放推理模型 Alphamayo 2;

七、Isaac Groot 参考机器人——人形机器人开发平台。

我对个人电脑的预判是:十年后,家庭 AI 超级计算机可能像家庭影院一样普及,持续运行您的智能体助手,越来越像 R2-D2,越来越像 C-3PO,而不再只是一台打开应用、点击输入的工具。这是一场与智能手机的诞生同等量级的再发明。

(本文首发钛媒体 APP,作者 | 硅谷 Tech_news,编辑 | 林深)

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容