关于ZAKER Skills 合作
钛媒体 12分钟前

Agent 改写互联网,赢家通吃越来越难了

文 | 深流研究所,作者 | 绛枫

过去一周,腾讯和阿里相继交出新一季财报。

2026 财年第四季度,阿里整体营收 2433.8 亿元,同比增长 3%。剔除投资收益后,反映主营经营质量的 Non-GAAP 净利润仅为 0.86 亿元,同比下滑近 100%。

增速看上去平淡,利润端压力陡增。但阿里第一次把 AI 账目摆到了台面上:2026 财年第四季度,阿里云外部商业化收入同比加速增长至 40%,AI 相关产品收入占比首次突破 30%,年化超过 358 亿元

腾讯 2026 年第一季度营收 1964.58 亿元,同比增长 9%;Non-IFRS 经营利润 756 亿元,同比增长 9%。它没有把 AI 单列为收入科目,而是嵌进广告、云与企业服务等业务线:

营销服务和企业服务收入均同比增长 20%,单季资本开支超过 300 亿元;混元、元宝、CodeBuddy、WorkBuddy、QClaw 等新 AI 产品仍处投入期,对当季 Non-IFRS 经营利润的净影响约 88 亿元。

两家公司讲述 AI 的方式不同,但财务结构上的转向是一致的:Capex、ARR、Token 调用量,这些过去更多出现在制造业和云厂商语境里的用词,正在替代 DAU、时长、GMV,成为互联网科技公司对外叙事的新 " 主语 "。

这是一组耐人寻味的变化。从 " 轻资产 " 到 " 重投入 ",互联网公司正在经历集体的叙事换挡。

过去二十年,互联网公司之所以能跑出极高的资本回报率,靠的是一组特殊的经济学条件:边际成本接近于零,规模效应近乎无限,网络效应一旦启动就自我强化,最终走向赢家通吃

AI 时代,这套法则开始失效了。每一次推理都要烧 Token、占 GPU、调度内存;每多服务一个用户、每多完成一次任务,都意味着实打实的算力成本。

当边际成本不再趋近于零,赢家通吃就变得越来越难了。如果找不到合理的商业化方式,用户规模反而会变成沉重的成本负担。

腾讯总裁刘炽平在财报当天的业绩会上说:当一项服务必须靠付费才能支撑,它大概率就不会是赢家通吃的生意。阿里首席执行官吴泳铭同日的发言几乎一致:AI 服务每一次调用都有可变成本,市场会由多个玩家共同占据。

一个关键问题被推到所有玩家面前:互联网过去赖以建立护城河的那套逻辑——入口、产品形态、衡量指标、商业模式——都将被重新定义。

入口的另一面:从 " 用户打开 " 到 "Agent 调用 "

「深流研究所」统计了过去半年,腾讯、阿里、字节在 AI 产品上的动作。

今年以来,三家大厂的产品发布节奏密集,进入春节之后加速明显。到了 4 月,行业甚至进入 " 每周一更 " 的发布期

值得注意的是,Agent 已经从概念走向 BAT 三家 AI 产品矩阵的发力主轴。其中,腾讯 Q1 财报也披露,年初以来累计上线数十款 Agent 及相关产品,覆盖入口、能力、底座三层,其发布密度在三家中最高。

中国互联网的竞争," 入口 " 一直是主战场——谁先承接用户需求,谁就能把需求导向内容、关系、交易和服务,比如微信承接通信,淘宝承接购物,抖音承接内容消费。

Agent 时代,入口的位置正在从前台界面,移到后台调用链。用户不再亲自点开每一个 App,而是把需求交给 Agent,由 Agent 在后台调用多个产品能力,直接把任务推进到结果。

钉钉 CEO 陈航在今年 3 月 AI 钉钉 2.0 发布会上的那句话,正是这层变化的注脚:" 过去是人用钉钉来工作,未来是 AI 用钉钉来工作。"

于是,关于 Agent 竞争分成了两个维度:

第一层是 Agent 的入口之争——用户习惯把任务交给谁,谁就是 AI 时代的 " 默认前台 ",延续的是抢用户心智的旧逻辑;第二层是 被调用之争——谁的能力能被 Agent 优先调用、编排、嵌进任务链路,谁才真正握住价值入口。

今年以来,阿里、字节、腾讯的 AI 产品更新,都是在这个方向发力。三家公司的做法差异,可以从 Agent 的从调用形态看出来。

阿里是 " 链式 " 调用,把 AI 接入交易和履约链路。从 1 月推出的千问任务助理,到 3 月阿里妈妈 AI 万相把商家经营拆成多 Agent 协同、飞猪 FlyAI 把旅行服务开放成可调用能力,再到 5 月千问与淘宝全面打通—— AI 购物从对话直接进入挑选、对比、下单。链路是预设的,Agent 沿着 " 需求、服务、交易、履约 " 这条线走完。

字节是 " 流式 " 调用,把 AI 接入内容生产和开发者的工作流。内容侧,Seedance 2.0 接入豆包、即梦、剪映,小云雀 AI 短剧 Agent、随变 AI、抖音 AI 创作入口陆续上线,视频生成能力被推到短剧、娱乐和分发场景。开发者侧,Trae、DeerFlow、扣子 Agent World 把 AI 接进代码开发、任务拆解和 Agent 执行环境。每一条工作流里,工具被串起来服务一个具体产出。

腾讯则是 " 网式 " 调用,不预设单一链路,而是把分散在微信、企业微信、文档、会议、地图、浏览器、云和安全体系里的能力,封装成一个个标准的 " 技能点 ",进而构建 Agent 可发现、可调用、可治理的能力网络。

这个网络大致分为三层:

入口层是 WorkBuddy、QClaw、ClawBot 等不同形态的 Agent 前端;能力层是 SkillHub 和官方 Skills,把文档、会议、地图、ima、QQ 浏览器的功能封装成可被 Agent 调用的标准模块;底座层是 ADP、CloudAgent、ClawPro、Agent Memory、Agent Storage 和 AI Agent 安全中心,提供运行、记忆、存储和治理。

马化腾在 3 月业绩会上谈到的 " 养虾 " 构想,指向的正是这种形态:不是把所有任务塞进一个超级入口,而是让不同 Agent 在不同场景里,按需调用不同能力。

这张能力网络还在持续迭代中。能力网络的价值,并不取决于单个节点,而是节点覆盖的密度,节点之间自由组合、调用的顺畅度。

一个关键变量是,微信侧的 Agent 入口尚未完全展开。微信独特的地方,不只是流量入口,而是背后连接着小程序、支付、公众号、服务号等一整套服务生态。如果未来 Agent 能够稳定调用小程序,微信生态里的能力就会从 " 用户主动打开 " 变成 "Agent 按任务调度 "。

对原生 AI 产品的新尝试:界面做减法,能力做加法

当入口从用户界面变成调用链路,产品本身的形态也会相应改变。

PC 原生的起点是鼠标、键盘和大屏,软件可以承载复杂的视觉层级和精确操作,于是有了文档、表格、窗口这套产品语言。

移动原生的起点是触屏、摄像头、随身定位,于是基于位置的地理服务、随时随地的关系连接、单手上下滑的信息流,催生了微信、美团、抖音等产品。

每一代原生产品的诞生,不是因为新技术变得可用,而是产品设计把新条件当作起点,从零生长。

那么,AI 时代新的基础条件是什么?

首先,是" 理解力 " 成为软件可以直接调用的基础设施。过去做产品,最难的事情之一是猜用户想干什么——按钮、菜单、引导流程,本质都是用界面替用户表达意图。AI 之后,意图理解不再是产品经理需要绞尽脑汁解决的设计问题,而是一种可以像调用数据库一样被调用的能力。

其次,产品具备非确定性的特征。过去,软件是确定性系统:相同输入对应相同输出,偏差被称为 bug。AI 时代的产品,每次输出的结果都不同,它可能会犯错、会幻觉、会误判。

再者,是产品具备了自主行动力。过去的软件是被动的——用户点击,它才响应;Agent 出现之后,AI 可以自己决定下一步做什么、什么时候做、调用谁。它从工具变成了行动者。

把这三个条件作为产品的设计起点,就能给 "AI 原生 " 画一个大致的蓝图:按照理解力、非确定性、自主行动力这三个新条件,从零长出来的产品形态。

这种形态在今年三家大厂的密集发布里,已经显出三个具体特征。

3 月底,钉钉、飞书、企业微信在一周内同步开源 CLI,行业讨论很热闹,但多数解读还停留在 "Agent 操作软件的新方式 "。这件事更深一层的意味在于,GUI 不再是软件的必需品

当意图理解变成基础设施,按钮、菜单、流程引导就成了多余的中间层—— Agent 不需要被引导,它需要被允许直接行动。AI 原生产品的特征之一,正是在做界面的减法、能力的加法

此外,腾讯今年密集发布的 Sandbox、Memory、Storage、AI Agent 安全中心,阿里和字节也都在补类似的部件。Sandbox 负责让 Agent 在隔离环境里试错。Memory 和 Storage 负责让 Agent 记住长期信息和任务状态。安全中心和权限系统负责决定 Agent 能做什么、不能做什么、做错了如何追溯。

在大模型还无法做到零幻觉、零失误的当下,一款原生的 AI 产品如果接受自己会出错、会幻觉、会跑偏,就必须从一开始预留容错空间——可中断、可回滚、可追问、可纠正、可审计。这不是 " 做完产品再补安全 ",而是产品设计的起点之一。

此外,三家今年的发布节奏呈现出一种碎片化的形态——从 GitHub commit、文档更新、能力上架到 Skill 入库,单个发布的 " 分量 " 明显变轻、频次明显变密。这种碎片化放在 AI 原生的框架下看,恰恰是合理的。

当产品的核心能力会随模型迭代、prompt 调整、工具组合而每日变化,发布的内容则越来越不像传统的产品,而是一个个能力单元,迭代更新的速度也将进一步加快。

产品标准在改变:从 " 用户停留了多久 " 到 " 任务推进了多远 "

产品发布的形态变了之后,下一个问题是:怎么衡量它有没有用?

移动互联网时代,互联网公司判断一个产品是否成功,核心的标准是 DAU、MAU、下载量、使用时长、留存和 GMV。这些指标背后有一个共同假设:用户打开越多、停留越久、点击越频繁,商业价值就越高。

但 Agent 产品不完全适用这套指标。从硅谷到中国,关于 "AI 该用什么指标衡量 " 的讨论密集出现。

2026 年初,行业里讨论过一个传闻:OpenAI 内部正在弱化 DAU,转向一个新的核心指标 TPD,也就是 Tokens Per Day。这个说法尚未得到 OpenAI 官方确认,但它提出的问题是成立的:DAU 反映的是 " 用户打开了多少次 ",TPD 反映的是 "AI 替用户调动了多少计算资源 "。

5 月 13 日,李彦宏在百度 Create 2026 开发者大会上提出,AI 时代可能需要一个新的度量衡——DAA,即日活智能体数。他的核心意思是,Token 更多反映算力消耗,不一定代表价值产出;真正能说明 AI 落地程度的,可能是每天有多少智能体在被使用、在完成任务。

相关的说法还有单位 Token 价值转化率、任务闭环触发率、用户自我纠错率、提示词摩擦效率等等。涉及企业 Agent 的效用衡量则更直接:单位任务耗时、返工率、单位人力产能等。

TPD 衡量的是算力消耗,回答的是 "AI 这台机器转得多快 ";DAA 衡量的是调度密度,回答的是 " 有多少 Agent 在被使用 ";任务交付衡量的是产出本身,回答的是 Agent 到底干完了什么。

这些指标的共同点是,它们不再围绕 " 用户待了多久 ",而是围绕 " 任务推进了多远 "

2025 年底,Anthropic 与 Material 对 500 多位技术领导者做的调研显示:57% 的组织已经将 AI Agent 用于多阶段工作流。调研附带的企业案例,更直观地说明了 "Agent 指标 " 长什么样:

网络安全公司 eSentire 把安全威胁分析时间从 5 小时压缩到 7 分钟,AI 与高级安全专家的判断一致率达 95%;医疗预约平台 Doctolib 的功能交付速度提升 40%。

国内公司也已经开始用同类指标对外披露。

比如,腾讯云在介绍 Agent Memory 时给出的关键数据,不是用户量,而是 "在复杂长任务中 Token 消耗降低超过 50%、任务完成率提升 23%"。

阿里通义灵码披露的核心数据是 "代码采纳率",即开发者接受 AI 建议的比例。其内部全员使用通义灵码企业版后,AI 代码生成占比达到 34%,研发效率提升 21%。

这些数据在传统互联网评价体系里很难对应位置,但在重视 " 调用 " 的 Agent 时代里反而成为最值得关注的数字。

值得注意的是,新指标解决了旧指标的方向性偏差,但还没解决自身的标准化问题。移动互联网用了十年才让 DAU 的口径相对统一,Agent 的指标体系同样得走一段很长的路。

Agent 重构互联网:价值锚点从流量分发走向任务交付

衡量指标变了,对应的商业模式也在重构。

5 月以来,豆包推出付费订阅,DeepSeek 大幅降价,阿里和腾讯同一天对外披露 AI 业务进展。围绕 "AI 这生意到底怎么算账 " 的讨论,密集出现在同一个时间窗口里。

过去一周,阿里、腾讯相继发布新一季度财报。阿里这本账,把 AI 算成 " 工厂 "。吴泳铭在财报发布当晚的发言里直接把 AI 比作制造业:" 必须建两个核心工厂,一个训练工厂,一个推理工厂,工厂规模决定未来收入规模。"腾讯没有把 AI 单独列出来,而是把 AI 的价值嵌进了广告、云与企业服务、游戏、内容等业务里。

阿里在向外界证明,AI 本身就是一门可独立计量、可单独定价的生意;腾讯则在证明,AI 是一种能让广告、云、协作等业务生态都更有价值的乘数。两种账法没有优劣之分,反映的是 AI 商业化正在沿着不同形态展开。

如果把视角从两家公司放大到整个 AI 行业,能看到三条正在被改写的商业路径。

第一条线,从 " 按使用权付费 " 到 " 按调用量付费 "。AI 让 " 智能 " 这件事,被像水电一样可计量、可定价。今年 3 月,黄仁勋在 GTC 大会上把 Token 称为 " 新的大宗商品 "。国家数据局披露,中国日均 Token 调用量从 2024 年初的 1000 亿,跃升到 2026 年 3 月的 140 万亿,两年增长超千倍

今年以来,每家公司发布新模型时,除了常规披露参数规模、跑分、下载量,还会强调模型的调用量。腾讯混元 Hy3 preview 4 月底上线后两周内,OpenRouter 最近一周调用量冲到 2.68 万亿 Token,并连续数周登顶全球榜首;DeepSeek 三款模型同时入围全球前十。

OpenRouter 这张本来给开发者用的 " 大模型选型榜单 ",变成了大模型公司新的 " 销量榜 "。

第二条线,是从 " 卖软件 " 到 " 卖任务 "。这一变化在海外更先发生。Salesforce 的 Agentforce 已经按 " 每次对话 2 美元 " 计费,Intercom 的 Fin 按 " 每个被解决的问题 " 计费——计价的颗粒度,从 " 软件被使用了 ",细化到 " 问题被解决了 "。国内的尝试还在更早期,腾讯会议 AI、企业微信 AI 助手、钉钉 AI 助理都在做按场次、按条数、按解决率的探索。

吴泳铭在业绩会上说过一句可以解释这条线的话:在企业里,只要部分工作任务创造的价值大于 Token 的成本,对 Token 的需求就是无限的。换句话说,当软件能直接交付结果,企业愿意付的就不再是 " 工具费 ",而是 " 代工费 "

第三条线,是从 " 独立产品 " 到 " 嵌入网络 "。这条线最难直接定价,是让 AI 渗透到现有业务,进而放大业务生态的商业价值。

阿里千问与淘宝打通后," 挑选、对比、下单 " 在对话里一次完成,价值不只在 AI 本身,还有 GMV 和履约效率。企业微信、钉钉把 AI 嵌进每一个协作动作,变现点也不只有 AI 助手单独收费,还在于企业渗透率和单客单价。

此外,腾讯总裁刘炽平在这次业绩会上把 "AI 赋能小程序 " 称为 " 未来发展的必然走势 " ——让智能体把小程序当作工具来调用,让微信生态里的资源逐渐 " 转化为智能体的技能 "。AI 在这条路径上不是新的收费对象,而是生态价值的乘数——它让广告点击率更高、让交易转化更短、让小程序留存更久。

这件事注定快不了。腾讯董事会主席兼首席执行官马化腾曾提到:"Agent 伙伴希望自己有流量和入口,但也不想自己被单纯地调用。" 其设计难点不只是技术,还有如何在 " 平台调用 " 和 " 开发者自主权 " 之间找到平衡。

估值坐标系换了:互联网公司正被重新定价

过去二十年,资本市场给互联网公司定价,用的是一套高度统一的坐标系:DAU 看规模、时长看粘性、GMV 看变现、网络效应看护城河。

这个坐标系背后是一个隐含前提——服务一个用户和服务一亿个用户,成本几乎相同。一旦跨过临界点,飞轮自动转起来,规模即利润,赢家通吃。这套逻辑跑通了 PC 时代,也跑通了移动时代。

互联网时代,DAU 意味着收入。AI 时代,DAU 则意味着成本。

当边际成本不再趋零,规模就不再天然带来正反馈,过往的估值标准也将被重新审视。取而代之的,是一组新的刻度:Capex 衡量产能、ARR 衡量持续性、Token 调用量衡量需求、代码采纳率和任务完成率衡量交付

这也让市场的关注点不再局限于投入,而是更看重兑现。

一个绕不开的参照系是 Anthropic。2023 年,它的年化收入约 1 亿美元;2024 年底,跨过 10 亿美元。进入 2025 年后,这条曲线几乎以季度为单位向上跳——年初约 20 亿美元,年中突破 50 亿美元,年底甚至超过 70 亿美元 ARR。

据多家媒体援引的内部规划,Anthropic 对 2026 年的收入指引区间,已经放到了 200 亿到 260 亿美元。三年之间,收入增长 200 倍以上,这个增速在 SaaS 与云服务历史上几乎没有先例。

Anthropic 的增长几乎押在两件事上:

一是 Agent,二是 coding ——恰恰是 AI 当前最容易被量化交付的两个场景。代码可以跑通或跑不通,任务可以完成或未完成,模型的价值能直接落到 " 产出 " 这一端,而不是停留在调用次数或对话轮数上。

这一点对当下的行业判断尤为关键。

今天的 AI 竞争里,弥漫着一种 FOMO 式的焦虑:模型必须更大、Capex 必须更高," 投入即正确 " 几乎成了默认叙事。

Anthropic 给出的另一种参照是——真正撑起估值的,并不是投入本身,而是投入能否被转化为可用、可持续、可衡量的交付能力。烧钱可以换来产能,但只有交付才能换来收入。

这次切换的意义,已经超出 " 业务转型 " 的范畴。它意味着资本市场需要重新给一家科技公司定价:

不再是 " 用边际零成本换规模回报 " 的高 ROE 生意,而是 " 用持续投入换能力密度 " 的长周期生意。前者奖励扩张速度,后者奖励重构的耐心。

赢家通吃或许越来越难了,但更长、更慢、也更需要耐心的竞争,才刚刚开始。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容