

过去四十年,这个市场的基本分工相对稳定:微软定义操作系统和软件入口,Intel 与 AMD 长期把守 x86 处理器平台,英伟达则从图形计算出发,后来又把 AI 加速推到更高的位置。

除了 GPU 、AI 工厂、物理 AI 等老生常态的话题,还有被微软和 ARM 提前预热、打着「A new era of PC」旗号的 RTX Spark。所有产品背后,都围绕同一个关键词展开:
Agent、Agent,还是 Agent。

在 Agent(智能体)叙事里,PC 被放到了一个新位置。
四十年来,Windows、开放 BIOS、芯片组、驱动、多媒体 API 一起塑造了个人计算。Windows 95 让 PC 从企业设备变成消费电子产品,几乎每个人都需要一台电脑。




笔记本厚度可做到 14 毫米,重量约 3 磅,覆盖 14 英寸到 16 英寸机型;机身采用精密加工铝合金,屏幕部分则配备色彩准确的 tandem OLED,并支持 NVIDIA G-SYNC,既服务创意工作,也兼顾游戏和高帧率视觉体验。
换言之,RTX Spark 面向的场景不只是端侧语音助手或轻量办公场景,它试图把部分数据中心 AI 能力、游戏图形能力和专业创作能力,放进个人电脑形态里。

在现场演示视频中,用户给出场地、草图、风格参考和需求后,运行在 RTX Spark 上的智能体会调用 Rhino 完成建筑与室内方案设计,并导入 Blender 结合 Flux 2 生成多角度渲染图,过程中用户可随时修改。
演示传递的信号不言而喻,PC 将从人手动操作软件转向智能体围绕目标调度工具,而典型案例是,Adobe Photoshop、Premiere 等应用也正为 RTX Spark 优化,并通过 MCP 接入本地智能体,成为自动化工作流的一部分。

笔记本对应移动办公、游戏和创作。
它可以本地运行 Nemotron 3 Ultra,也可以连接 Claude、Codex 或其他云端模型。台式机更像家庭里的个人 AI 主机,可以 24 小时运行智能体,连接笔记本、显示器、摄像头、安防系统、家电和其他设备。

DGX Station for Windows 配备 748 GB 内存、20 petaflops 算力和 8 TB 每秒内存带宽,可以在桌面环境中运行万亿参数模型。开发者可以在本地完成模型开发、调试和测试,再部署到云端。


对于想在本地跑 LLM、又需要大内存和较强 AI 算力的人来说,RTX Spark 的出现,可能会成为除 Mac 之外的另一个选项。
有用 AI 时代到来,一切为 Agent 而生
如果把过去两年的行业变化归纳为一句话,那就是有用的 AI (useful AI)已经到来。而 Agentic AI 的第一批应用场景,正是软件开发。

黄仁勋借此反驳了「AI 会减少就业岗位」的说法。在他看来,AI 提高了工程师的产出,企业反而更愿意招聘更多工程师。究其原因,同样的人力成本可以创造更高生产力,软件开发的价值也会继续扩大。
更深层的变化发生在应用形态上。
过去的软件由应用、代码和操作系统组成,但智能体时代的计算方式则换了一套流程:用户给出目标,模型理解意图,运行环境调度流程,工具执行任务,记忆系统保存上下文,最后产出结果。
整个过程包含观察、理解、推理、规划、行动和工具调用。

智能体成为新的应用形态后,支撑智能体运行的计算底座也要重新设计。
发布会上,黄仁勋宣布,英伟达下一代 AI 超级芯片平台 Vera Rubin 已进入全面投产阶段。它是英伟达迄今规模最大的 POD 级平台之一,也是面向 Agentic AI 设计的新一代 AI 工厂核心系统。

它面向的是智能体从输入到执行的完整流程。
智能体处理提示词、理解上下文、推理规划、调用工具、访问数据库、运行代码和检索长期记忆时,会同时牵动 GPU、CPU、网络、内存、存储和安全系统,因此 Rubin GPU 负责主要计算,Vera CPU 负责调度和数据管线,BlueField 4 处理安全隔离与存储,Spectrum X 负责大规模联网。
Vera Rubin 之后,黄仁勋还单独讲了 Vera CPU。
在他看来,过去的 CPU 主要服务于人类用户和传统云计算租赁,计算资源按核心、按时间出租,响应速度以秒为单位衡量。但智能体的运行节奏完全不同:
它们会频繁调用工具、访问数据库、运行代码、检索记忆,每一步都要求更低延迟。

Vera CPU 的设计逻辑正在于此。
过去 CPU 为人服务,Vera CPU 则面向数量远多于人类的智能体。它采用自研 Olympus Core,重点放在单线程性能、核心间带宽、总带宽和能效。它有神经分支预测器、10 路解码引擎、大型乱序执行引擎和先进预取机制。内存部分采用 LPDDR5X,并支持多错误校正。

相比 x86 CPU,Vera 在部分场景中峰值内存延迟降低 40%,智能体 sandbox 性能达到 1.8 倍,SQL 性能达到 3 倍,实时流处理性能达到 6 倍。
Agent 是新的工作负载,CPU 的角色也随之变化。它不再只是云计算里可出租的通用核心,而是 AI 工厂里调度模型、工具、内存、数据库和安全系统的关键部件。
现在买电脑,是用来打造 AI 工厂
黄仁勋反复强调,AI 的商业逻辑已经改变。过去算力常被视为成本,现在 token 是可以带来收入的单位。只要 token 能产生收入,算力就成了生产能力。

黄仁勋提到,未来 1 GW 级 AI 工厂的投资可能达到 500 亿、600 亿美元,甚至进一步上升到 800 亿至 1000 亿美元。资本成本越高,系统上线速度、吞吐效率、可靠性和生命周期越关键。

而 NVIDIA DSX 这套生态系统囊括了一大批的云服务公司和 AI 基础设施企业,包括 CoreWeave、Nebius、Nscale、Naver Cloud 等,以及服务的客户包括 Cursor、World Labs、Revolut、Shopify、Google 等等,帮助所有的企业用户用 Token 来获得收入。
硬件之外,企业如何真正用上智能体,是另一条线。
黄仁勋把企业构建智能体所需能力分为四类:模型、调度系统、工具与技能、运行环境。对应到产品上,就是 Nemotron、OpenShelf、CUDA X libraries 和 AI 平台。


黄仁勋还提到,Nemotron 3 Ultra 模型、训练脚本和训练数据都会开放,企业可以在此基础上加入自己的行业数据和专有知识。


云端需要 Vera Rubin 和 AI 工厂。PC 需要 RTX Spark 和 Windows 智能体平台。企业需要 Nemotron、OpenShelf 和 CUDA X 工具链。汽车需要 Alpamayo、Hyperion 和自动驾驶 runtime。人形机器人需要 Isaac Groot、Thor、仿真和数据生成系统。
当我们把整场演讲连起来看,将近两个小时的超长发布,黄仁勋讲的主题已经超出常规新品发布。

DSX 面向 AI 工厂建设,把电力、冷却、网络和运维也纳入系统设计。Nemotron、OpenShelf 和 CUDA X libraries 面向企业智能体开发。Cosmos 3 把智能体推进物理世界。Alpamayo 2 和 Hyperion 面向自动驾驶,Isaac Groot 则把人形机器人也放进同一套平台逻辑。
NVIDIA 过去最核心的身份是 GPU 供应商,后来变成系统公司,现在又试图成为 AI 基础设施公司。
黄仁勋在这场大会想讲清楚的,也正是这件事:AI 竞争已经从模型扩展到一整套计算体系,覆盖个人电脑、企业软件、数据中心和物理设备。
文|莫崇宇、张子豪