APP下载

关于ZAKER

合作

Hacker News 22小时前

Cloudflare 推出统一推理层，支持跨供应商 AI 模型调用

人工智能领域正经历快速迭代：一个适合智能编码的模型，可能在短短三个月内就被来自不同供应商的新模型取代。同时，实际应用中往往需要结合多个模型的能力。例如，客服系统可能使用轻量级模型分类用户消息，大型推理模型规划操作流程，再由另一个模型执行具体任务。

这种多模型协作的方式带来了显著挑战：如何避免被单一供应商绑定？如何有效管理跨供应商的成本、延迟和可靠性？这些问题在构建智能体（Agentic AI）时尤为突出。一个简单的聊天机器人可能只需一次推理调用，而复杂智能体可能需要串联十次调用才能完成任务——此时，50 毫秒的延迟可能扩大到 500 毫秒，单点故障也可能引发连锁问题。

为解决这些痛点，Cloudflare 正式推出统一推理层服务，通过单一 API 访问任意供应商的 AI 模型，帮助开发者实现高效、可靠的多模型集成。

一个目录，一个统一端点

从今天起，开发者可以通过与 Workers AI 相同的 AI.run ( ) 接口调用第三方模型。切换供应商（如从 OpenAI 切换到 Anthropic）仅需修改一行代码：

const response = await env.AI.run ( 'anthropic/claude-opus-4-6', { input: 'What is Cloudflare?' }, { gateway: { id: "default" } } ) ;

对于非 Workers 用户，Cloudflare 还将在未来几周推出 REST API 支持，方便在任何环境中访问完整模型目录。

目前，Cloudflare 已整合来自阿里云、AssemblyAI、字节跳动、谷歌、InWorld、MiniMax、OpenAI等 12 家供应商的 70 多个模型，并支持通过统一积分支付费用。开发者可通过模型目录找到最适合自身需求的模型。

此外，AI Gateway 还提供集中化平台，帮助监控和管理跨供应商的 AI 支出。通过自定义元数据，您可以按属性（如免费用户与付费用户、特定工作流）细分成本：

const response = await env.AI.run ( '@cf/moonshotai/kimi-k2.5', { prompt: 'What is AI Gateway?' }, { metadata: { "teamId": "AI", "userId": 12345 } } ) ;

通往首个令牌的快速路径

在实时智能体场景中，速度至关重要。用户的感知速度取决于首个令牌的生成时间，而非完整响应的时间。即使总推理时间为 3 秒，让首个令牌提前 50 毫秒生成，也能显著提升用户体验。

Cloudflare 的全球网络覆盖 330 个城市，AI Gateway 能够最大限度减少网络延迟。此外，Workers AI 托管的开源模型（如 Kimi K2.5 和实时语音模型）可通过内部网络直接调用，无需经过公共互联网，从而进一步降低延迟。

具备自动故障转移的可靠性设计

除了速度，可靠性也是关键。智能体的工作流通常依赖于前序步骤的结果，一旦某个环节失败，可能影响整个下游链条。

AI Gateway 通过自动故障转移机制解决了这一问题：如果某模型在多个供应商上可用，当其中一个供应商发生故障时，请求将自动路由到其他供应商，无需额外编写逻辑。

对于长时间运行的智能体，AI Gateway 还支持断连恢复功能。即使智能体在推理过程中中断，也可以重新连接并检索缓冲的响应，而无需重新发起调用或重复支付。

随着 Replicate 团队加入 Cloudflare，更多功能正在整合中。未来，您将能够通过 AI Gateway 访问 Replicate 上的模型，并将其托管到 Workers AI。

要开始使用，请访问AI Gateway 文档或Workers AI 文档。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

Cloudflare 推出统一推理层，支持跨供应商 AI 模型调用

宙世代

一起剪

相关阅读

斯坦福权威报告：阿里AI贡献全球第三 中国第一

影石相机来了：可换镜头、前后双波轮

海尔旗舰店深夜标价异常 2499冰柜折后76元：网友连下三单被拒发货 客户回应

不跳舞、不打拳、也不拧螺丝，陈震和他的机器人扎进后厨炸鸡块

苹果宣布《明日方舟：终末地》光追首发iPhone 17 Pro 电影级画质 满帧运行

最强小屏旗舰来了！OPPO Find X9s Pro参数出炉

8亿扶持资金涌入！微短剧行业转向，七大平台重金押注真人+AI

一代经典国民神卡RTX 3060 12GB要复活！这价格诱人

AI眼镜，阿里求稳

黄仁勋最新深度分享：英伟达的护城河、TPU威胁与生态建设

小米手机开启10000mAh时代！REDMI Note 17系列已在路上：充电宝直接下岗

不怕成本高 台积电表态：扩大对美国投资 更有信心了

阿里动刀，电商Token税来了？

外卖小哥看完后背发凉！高德机器狗首度现身街头：过马路等红绿灯 会自己买奶茶

量化派品牌升级“智能物种”第一股，独家对话MIT毕业的机器人博士CTO

最新评论

最新AI资讯

热门推荐

企业资讯

斯坦福权威报告：阿里AI贡献全球第三中国第一

海尔旗舰店深夜标价异常 2499冰柜折后76元：网友连下三单被拒发货客户回应

苹果宣布《明日方舟：终末地》光追首发iPhone 17 Pro 电影级画质满帧运行

不怕成本高台积电表态：扩大对美国投资更有信心了

外卖小哥看完后背发凉！高德机器狗首度现身街头：过马路等红绿灯会自己买奶茶