
根据该模式,相关客户可通过合作云服务商获得 GPU 算力,英伟达则在取得硬件销售收入的同时,与云服务商分享部分云服务收入。
这意味着,英伟达并不直接向初创企业出租 GPU 算力。公司主要提供 GPU、软件平台和信贷支持,Sharon AI、Firmus Technologies 等合作伙伴则负责将英伟达提供的这些资源转化为可供客户使用的云端算力。
随着人工智能从模型开发迈向规模化推理应用,企业对算力的需求正在持续增长。训练完成后的模型需要长期运行,并大规模生成词元(tokens),这推动算力基础设施向持续运转、支持多客户同时使用的 AI 工厂转型。
不过,新兴人工智能企业通常难以承担数据中心建设所需的大量资金。即使企业承诺长期购买算力,也未必能帮助云服务商获得融资。为解决这一问题,英伟达推出收入分成和信贷支持模式,帮助 AI 云服务商采购英伟达芯片并扩大算力供应。
对于大模型开发商、推理服务提供商和智能体平台而言,这一模式可以缩短获得其算力的时间。相关企业无需自行完成数据中心的选址、电力采购、项目建设及硬件部署,即可通过合作云服务商使用英伟达全栈加速计算资源。
对于英伟达而言,该模式也意味着收入来源进一步扩展。公司既可以通过销售 GPU 获得产品收入,也能与云服务商分享相关云服务收入,从而形成与算力使用量挂钩的持续性收入来源。
目前,英伟达已经公布两家首批合作伙伴,相关项目计划部署最多 21 万颗 GPU。其中,澳大利亚 AI 云服务商 Sharon AI 将部署最多 4 万颗 Grace Blackwell GB300 GPU。
另一家澳大利亚人工智能基础设施公司 Firmus Technologies 正在印度尼西亚巴淡岛建设一座 DSX AI 工厂园区。该园区预计将扩大至 360 兆瓦,并计划部署最多 17 万颗英伟达 GPU。
Firmus Technologies 联合首席执行官 Tim Rosenfield 表示,AI 原生企业需要可扩展、兼具能源效率和成本效率的计算基础设施,才能在全球竞争中立足。该公司正在建设符合英伟达 DSX 标准的 AI 工厂,以帮助更多客户获得开发和扩大人工智能业务所需的算力。
英伟达在官网中提到,Baseten、Fireworks AI 和 Together AI 等 AI 原生企业已经显示出未来算力需求的方向。这些公司需要快速获得 AI 云算力,用于模型训练、推理、微调及大规模智能体推理。
CNBC 指出,GPU 供应紧张、算力成本波动和融资压力正成为人工智能企业扩张的重要限制。GPU 一度被市场比作 " 石油 ",部分算力资源甚至被纳入期货类交易安排。
与此同时,越来越多人工智能公司开始通过收入分成和股权合作等方式,与芯片制造商及云服务商建立更紧密的利益关系。英伟达这一新模式能否扩大至更多合作伙伴,并形成稳定的云服务分成收入,将成为后续关注重点。