文 | 大模型之家
当 AI 从 " 陪人聊天 " 的工具走向 " 交付结果 " 的 Agent,命运赠送的赛博礼物,早已暗中标记了算力的价格,全行业迎来了向真实生产力要 ROI 的诚实标价。
6 月 24 日,豆包专业版正式上线。标准套餐 68 元 / 月、加强套餐 200 元 / 月、高级套餐 500 元 / 月,这三级阶梯定价的推出,意味着这个曾经以免费获取大量用户的国民级 AI 助手正式转向付费模式。

4 月 28 日,GitHub Copilot 宣布从 6 月 1 日起全面转向按 Token 计费,废除了原有的固定额度订阅;4 月 29 日,Anthropic 取消了 Pro 计划中 Claude Code 的免费使用权;6 月 12 日,Cursor 在下调定价的同时,新增了企业支出管控功能。而早在去年 9 月,Cursor 从固定请求次数转为 " 订阅 + 用量 " 双轨制,10 月 Amazon Kiro 结束免费期正式收费。
从国内到硅谷,整个行业正在经历一次商业模式的集体转向。
免费模式不是被 " 终结 " 的,是被 " 撑爆 " 的
虽然大模型在技术迭代下,底层模型推理成本在不断下探,但这并没有带来应用层账单的缩减。
以 API 定价为例,Anthropic 的 Sonnet 4.5 每百万输入 Token 收费 3 美元、输出收费 15 美元,而 DeepSeek V4-Pro 缓存命中输入仅为 0.025 元 / 百万 Tokens、输出为 6 元 / 百万 Tokens。尽管两者之间存在上百倍的价差,但在应用层,一个 Agent 任务所消耗的 Token 数量是普通对话的数十倍。
" 帮我写一封邮件 " 只需要几百个 Token,但如果让 Agent 执行 " 整理本周项目文件、生成汇总报告、群发给负责人并在日历上添加会议 " 这样的任务,则需要经历读取文件、分类、生成文本、操作 API 等多个环节,单次任务链的 Token 消耗量经常破万甚至破十万。
这种消耗模式摧毁了固定订阅制赖以生存的交叉补贴逻辑。在传统对话模式下,轻度用户与重度用户的成本差在可控范围内,厂商可以用轻度用户的利润去补贴重度用户。但在 Agent 时代,重度用户与轻度用户的算力消耗拉大到了数量级差异,对厂商造成的成本差可达 50 到 100 倍。
云端开发平台 Replit 在引入 AI Agent 功能后,毛利率从 36% 暴跌至 -14%,证明了固定定价无法覆盖真实的资源消耗。SaaS 公司 Intercom 引入按每次 AI 问题解决收取 0.99 美元的模式后,部分企业的月度账单直接从 50 美元飙升至 3 万美元。
这里存在一个 AI 版本的 " 杰文斯悖论 ":底层大模型单价越低,反而越刺激应用层的用量爆发,导致总 Token 消耗增长速度远超单价降幅。单价越降,账单越大。
此外,资本市场的态度也在发生变化。2024 年行业倾向于通过免费换取用户,但 2025 年下半年起,投资人的耐心明显消退。Anthropic 的年化营收从 2025 年底的 90 亿美元冲至 300 亿美元,拥有超过 1000 家年消费超 100 万美元的企业客户。市场已经证明了付费的可行性,免费补贴的模式在财务上已经难以为继。
从国内到硅谷,定价锚点的 " 双向奔赴 "
对比 2026 年 6 月全球主流 AI 产品的定价,可以发现个人与企业级市场的价格区间正在出现明显的收敛现象。
如果深度分析豆包专业版的定价策略,不难发现其经过了精确的心理计算:68 元的起步价约等于两杯咖啡的价格,避开了用户的深度决策成本,而 38 元的学生价则延续了字节跳动低价锁定长期用户的惯性。

而当用户需求向重度或企业级场景延伸时,分层计费则进一步拉开了空间。Cursor 的 Max 5x 方案为 100 美元 / 月,OpenAI 的 Codex 重度方案同样为 100 美元 / 月,Google 甚至针对高端生产力场景推出了 249 美元 / 月的 AI Ultra 方案。
这种定价格局的对齐,说明大模型不再被单纯视为技术展示的玩具,而是被作为生产力软件进行定价。可见,中国大模型市场已经走出了价格战的 " 内卷 " 状态,但当技术形态转向 Agent 后,无论中外厂商,都必须回归算力经济学的真实成本。
硅谷厂商如 GitHub Copilot 废除不限量承诺、Cursor 一年内多次调整定价,本质上也是在放弃纯订阅幻想,向基于用量的务实定价靠拢。中外市场的定价锚点最终在 " 产品能创造多少商业价值 " 这一逻辑上达成了对齐。
" 干活 " 比 " 聊天 " 贵十倍,但 ROI 比聊天高一百倍
事实上,即使是被行业视为软件付费意愿偏低的国内市场,其实并不缺乏对于软件付费的购买力,相反,国内的用户对于软件付费更为 " 精明",意愿的强弱更多取决于 AI 交付的是过程还是结果。
豆包专业版的功能列表包含了操作本地电脑、使用浏览器、调用 Skills 技能、定时任务、流程自动化、金融分析等。这些功能不再是辅助用户写一段文案或查阅资料,而是去替代具体的工作任务,实现业务闭环。
生产力的高低直接决定了用户的付费痛感。编程场景之所以最先跑通商业闭环,正是因为其投入产出比(ROI)极易被量化。Claude Code 的年化营收在短短两个月内从 10 亿美元飙升至 25 亿美元,全球 GitHub 上 4% 的公开代码提交由其生成。官方此前称取消 Pro 计划中的免费权是针对 2% 新用户的 A/B 测试,但这组数据揭示了其背后的商业底气。对于一名时薪 50 美元的程序员而言,花费 200 美元的月费如果能省下 40 小时的编码和调试时间,账面上就等于带来了 1800 美元的净回报。

因此,500 元的定价目标极为明确,即指向那些能用 AI 直接产生营收或节省人工成本的群体。
为了支撑这一按量计费体系,行业正在加速建设计量基础设施。GitHub Copilot 的 AI Credits、Cursor 的 Usage Credits、Amazon Kiro 的 Credit 以及豆包的三级额度体系,都不约而同地选择了 "Credit(积分 / 额度)" 作为计量单位。
GitHub Copilot 保持了 Pro($10/ 月)和 Pro+($39/ 月)的基础价格不变,但 Chat 模式和 Agent 模式等每一次调用都会扣减 Credits,这导致重度用户月费可能飙升至数百美元。这种设计避开了让用户去理解抽象的 Token 概念,而是将其转化为任务消耗的直观感知。
行业数据显示,截至 2026 年,已有 45% 的 AI Agent 公司采用了某种形式的按量计费。整个 AI Agent 市场规模预计将从 2025 年的 73.8 亿美元增长到 2030 年的 471 亿美元,年复合增长率达到 44.8%。
按量付费是解药,但药方里还缺三味药
将用户付费与厂商研发投入绑定,固然为大模型行业建立了一条可持续的商业路径,但从免费转向按量付费的过渡期依然暴露出三个核心冲突。
首先是 " 计量焦虑 " 对用户习惯的抑制。当 GitHub Copilot 取消不限量承诺后,开发者社区曾出现明显的反弹。固定订阅让用户拥有安全感,可以无成本地反复试探和调教 AI;而按量付费则让每一次点击都带上了财务标签。这种类似抄电表的心理压力,可能会让用户减少探索性使用,进而对产品的长期留存和粘性产生负面影响。
其次是中国市场特有的价格战争夺。豆包的 68 元定价卡在了一个合理的生产力软件档位,但国内市场的竞争往往伴随着剧烈的价格透支。如果 Kimi、百度或 DeepSeek 为了争夺市场份额,跟进更低价的策略甚至开启新一轮的价格战,整个赛道的利润率将被迅速压缩。对于缺乏资金储备的初创大模型公司而言," 质量尚未跨越,价格已被打穿 " 的恶性循环将是一个巨大的威胁。
最核心的考验在于,AI 的能力能否配得上其价格。在免费时代,用户对 AI 的幻觉、数据串户、定时任务漏跑等错误的容忍度极高。但一旦用户开始支付每月数百元的真实费用,其对交付结果的容忍度将瞬间归零。付费后的不稳定性对产品生态的破坏性,远超免费时期。
2026年不是 AI 收费的终点,而是 " 真收费 " 的起点。此前的免费是伪装成商业模式的增长手段,现在的收费是对真实产品价值的第一次诚实标价。这条路能不能走通,不取决于定价策略有多精巧,而取决于一个更朴素的问题——用户付完钱之后,有没有觉得 " 这钱花得值 "。