关于ZAKER Skills 合作
钛媒体 22小时前

戳破 Token 泡沫,李彦宏为 AI 造“新尺”

文 | 零态 LT(ID;LingTai_LT)作者|张谦 , 编辑|胡展嘉

Meta 内部曾流行过一个叫 "Claudeonomics" 的排行榜。

8.5 万名员工,以 30 天内谁消耗的 Token 最多来排名。结果触目惊心:全员 30 天烧掉了 60 万亿 Token,榜首那位单月就卷走了 2810 亿 Token。

为了冲榜,有人盲目调用模型,算力空耗了一大把,实际产出却寥寥无几。如果你仔细想想,这件事的荒诞之处不在于员工攀比,而在于整个行业都在用同一套逻辑运转—— Token 消耗量成了衡量 AI 繁荣的默认指标。公司比谁家 Token 烧得多,厂商比谁家的 "Token 亿万富翁 " 多,行业会议上的 PPT 堆满了天文数字。

但 Token 只是成本,不是收益。就像你不会用一家公司的电费账单来衡量它的盈利能力,你也不该用 Token 消耗来丈量 AI 创造的价值。

5 月底的 Create2026 百度 AI 开发者大会上,李彦宏抛出了一个新概念:DAA —— Daily Active Agents,日活智能体数。在他之前,Salesforce 已经提出了类似的 AWU,Gartner 也发了报告说 Token 是误导性指标。

全球 AI 产业似乎同时走到了一个临界点——从 " 堆算力 " 到 " 交结果 ",度量衡该换了。

60 万亿 Token 烧出了什么

Meta 那个 Token 排行榜的故事值得多说几句。

据天眼查及媒体公开信息,"Claudeonomics" 覆盖 Meta 全公司 8.5 万名员工,以 30 天为周期排名。榜首单月消耗 2810 亿 Token,全员累计 60 万亿。内部甚至形成了一种风气:Token 消耗量等于工作投入度。排名靠前的员工被视为 " 更努力 ",排名靠后的则可能被暗戳戳地贴上 " 不够 AI 化 " 的标签。

结果呢?为了冲高排名,不少员工盲目调用大模型,重复生成、无效推理、冗余计算——算力烧了一堆,业务价值产出寥寥。这哪里是生产力革命,这是数字时代的面子工程。

Meta 的故事虽然极端,但它折射的是行业通病。Token 消耗,正在被越来越多的 AI 厂商视作反映 " 规模、采用度和市场领导力 " 的信号。

但 Gartner 的一份报告直接给这种逻辑泼了冷水:"Token 消耗是衡量 AI 市场领导力的误导性指标。" 理由很简单—— Token 消耗发生在 AI 价值链的最早期阶段,远早于决策形成或业务成果实现。它反映的是计算活动本身,而非经济或战略影响力。

讲真,用 Token 来衡量 AI,就像用油门踩得多深来衡量一辆车跑得多快。油门踩得猛不代表速度快,可能只是在空转。Anthropic 的反例更有说服力。据天眼查及媒体公开数据,Anthropic 旗下 Claude 全系产品的 DAU 总和,仅为 OpenAI ChatGPT 的约 2%。

但 2026 年初,Anthropic 的年化营收 ARR 已经反超 OpenAI ——从 2024 年的 10 亿美元飙升至 2026 年 4 月的 300 亿美元,5 月进一步达到 440 亿美元。2% 的 DAU,100% 以上的营收反超。

这背后是什么逻辑?

OpenAI 走的是 C 端流量路线,主打开放注册、免费使用、DAU 拉满。Anthropic 从一开始就是 B 端价值思维,直接服务企业客户,按任务交付收费。一个追求 " 多少人用 ",一个追求 " 多少事办成 "。

结果证明,在 AI 时代," 高价值任务交付 " 远比 " 用户规模 " 更值钱。平心而论,OpenAI 内部也意识到了这个问题。有消息称,OpenAI 正在弱化 DAU 指标,转向更贴近产出的新度量标准。连 Token 经济学的最大受益者都在转身,说明风向确实变了。

从 DAU 到 Token,度量衡换了两次,但都没答对核心问题—— AI 到底创造了什么价值?DAU 量的是 " 人来了 ",Token 量的是 " 钱烧了 ",两者都没量到 " 事成了 "。

移动互联网时代,流量就是王道,DAU 足够解释一切。但 AI 不是互联网,它不是卖广告、卖注意力的生意。AI 是替代劳动力、完成任务、交付结果的生意。你要量的不是 " 有多少人来用 ",而是 " 有多少活被干完 "。

这把新尺子,终于有人造出来了。

DAA,从 " 你用 AI" 到 "AI 替你干 "

5 月 13 日,北京国家会议中心,Create2026 百度 AI 开发者大会。李彦宏站在台上,没有像往常一样先秀模型参数,也没有搬出多少亿 Token 的消耗数据。

他抛出了三个字母:DAA。Daily Active Agents,日活智能体数。这不是一个产品,也不是一项技术。这是一个度量衡,一把重新丈量 AI 产业的尺子。

他说得很干脆:"Token 不一定代表终局,Token 代表的是成本,不是收益。" 台下安静了几秒,然后掌声起来了。懂行的人听懂了——这是在拆整个行业的台,也是在搭一个新舞台。

怎么理解 DAA?

得先弄明白它跟 DAU、跟 Token 到底差在哪。DAU,日活用户数。你每天早上打开微信、刷抖音,你就是某个 App 的 DAU。DAU 量的是 " 人来用 ",人在操作,人在消费。Meta 把 DAU 干到了 34 亿以上,全球最高。

但 DAU 有一个本质问题:它量的是注意力,不是生产力。你刷了三个小时短视频,DAU 贡献拉满了,但你产出什么了吗?

Token,大模型时代的燃料单位。每问一次 ChatGPT,每生成一张图,背后都是 Token 在燃烧。但 Token 的问题更直接:烧得多不等于干得多。你跟 AI 闲聊一百句,和 AI 帮你自动写完一份财报分析,消耗的 Token 可能差不多,价值天差地别。

用李彦宏的话说," 无谓的 Token 消耗 " 跟价值本质隔了十万八千里。

DAA 不一样。它问的是:今天有多少个智能体在替你干活?不是 " 你用了多少次 AI",而是 "AI 替你交付了多少结果 "。这个差别,不是措辞上的,是范式上的。从 " 你用 AI" 到 "AI 替你干 ",六个字,背后是整整一个时代的切换。

李彦宏不是临时起意。

据百度内部信息,4 月那场内部讲话里,他已经在铺垫:" 衡量有多少智能体在持续活跃、持续替用户工作,这代表了 Token 消耗的效率。"

效率——这个词很关键。

他不是不要 Token,他是要 Token 花得值。同样的算力、同样的电力、同样的芯片,能不能让 Agent 多干几件事、多帮几个人?这才是真问题。而这个问题,不止百度在问。

Salesforce 提出了 AWU,Agentic Work Units,智能体工作单元。一个 AWU 等于一个 AI 智能体独立完成的一项任务——从听懂指令到逻辑推理再到调用工具,全流程跑通。AWU 的核心指向跟 DAA 异曲同工:用更少的 Token,干更多的活。

如果说 DAA 算的是 " 有多少工人在上班 ",AWU 算的就是 " 每个工人交了多少件成品 "。一个看规模,一个看产出,合起来就是智能体经济的全貌。

谷歌的动作更大。

5 月 20 日 I/O 2026,皮查伊宣布全面进入 "Agentic Gemini Era"。Antigravity 2.0 编排框架、Gemini Spark 个人智能体、Search Agents ——一整套智能体基础设施砸下来。连芯片都专门为 Agent 改了,TPU 8i 叫 " 智能体专用芯片 ",A2A 协议解决智能体之间怎么通信。

谷歌这是在用全部身家押注一个判断:未来不是人跟 AI 对话,是 AI 跟 AI 协作,人只在关键节点拍板。但有意思的是,皮查伊在台上还在大谈 Token 降本。李彦宏已经把尺子换了。这半步之差,有时候就是一个身位。

清华的胡麒牧说了一句话值得细品:" 从 DAU 到 DAA,范式彻底变了。聪明的企业已经在想:我的 DAA 是多少?" 这问法本身就说明问题。以前企业问 " 我有多少用户 ",以后要问 " 我有多少数字员工 "。

Agent 时代的基础设施是什么?不是光有大模型就行的。百度的打法,恰恰是一张全栈拼图。

芯——昆仑芯 3 万卡级集群,天池 256 卡超节点 6 月上市,自研芯片撑住算力底座。

云——中国 AI 公有云市场连续六年第一,Agent 要规模化运行,离不开云。

模——文心 5.1 搜索能力登顶国内,预训练成本压到业界的 6%,模型本身得又强又便宜。

体—— DuMate 通用智能体、秒哒无代码平台、伐谋 2.0 决策智能体,从个人到企业到复杂决策,层层覆盖。

这四块拼在一起,才撑得起 DAA 生态。

没有自研芯片,Agent 跑不起来;没有 AI 云,Agent 扩不了容;没有大模型,Agent 没脑子;没有智能体平台,Agent 到不了用户手里。少了哪一块,DAA 都是空中楼阁。

李彦宏说,未来 DAA 很容易超过 100 亿。全球 DAU 最高才 34 亿,DAA 凭什么翻三倍?他的逻辑很简单:这 100 亿个智能体不会从天上掉下来,它们需要每一个人去创造。一个人可以拥有好几个、好几十个 Agent,有的帮他回邮件,有的帮他管库存,有的帮他盯行情。

Agent 不是 App,不需要用户一个个去下载、去打开。Agent 是干活的,是替你跑腿的,是你数字化的分身和助理。34 亿人,每人三个 Agent,就是 100 亿。这个算术不难,难的是怎么让这 100 亿 Agent 真的转起来、真的在创造价值。

所以 DAA 不只是一个数字。它是一个问题,问给整个行业:你的 Agent,今天干活了吗?

100 亿 DAA,不是一个远景

Gartner 画了一条线:2026 年,40% 的企业应用里会住进任务型 AI 智能体。这不是什么五年规划,就是明年后年的事。

天眼查媒体综合信息显示,中国企业级智能体市场规模已经摸到 480 亿元,全球没有第二个市场比中国更适合让智能体先跑起来。听起来像口号?看看你的手机。你已经在用导航 Agent 规划路线,用支付 Agent 完成交易,用推荐 Agent 决定今晚看什么剧。这些 Agent 现在还各干各的,但它们的数量,已经远远超过了你通讯录里的真人好友数。

一个人拥有多个智能体,一家企业部署成百上千个——这种配置会在未来三年内成为常态。Meta 现在全球 DAU 超过 34 亿,这已经是一个天文数字。但 DAA 呢?一个人配五个 Agent 就是 170 亿。

100 亿 DAA 不是远景,它来得会比大多数人想象中快得多。

范式转移到底转的是什么?说白了,就是从 " 堆算力 " 转向 " 交结果 "。以前卖 AI,比的是谁参数多、谁卡多、谁的 Token 消耗量大。这套逻辑正在失效。客户要的不是你家烧了多少电,是问题解没解决。从 " 消耗 Token" 到 " 交付价值 ",从 " 人用 AI" 到 "AI 替人干 " ——这不是措辞的变化,是商业本质的重构。

百度在这个节点上提出 " 自我进化 ",藏着三层意思。

智能体自己进化,从被动响应变主动执行;人类个体跟着进化,从单打独斗变超级个体;企业组织被迫进化,从人与人之间分工,变成人与智能体的混合编队。最小的生产力单元不再是 " 团队 ",而是 " 一个人 + 一支智能体编队 "。

一个人就是一支队伍,这话放到 2023 年会被当成鸡汤,放到 2026 年可能就是基本事实。当 CEO 们坐下来讨论 " 智能体优先策略 " 时,他们其实在面对一个更根本的问题:公司是为人设计,还是为结果设计的?

DAA 不是新概念,它是一个新方向。方向一旦确立,速度会快得吓人。100 亿 Agent 同时在线给人类干活的那一天,我们大概会回看 2026 年 5 月,把它当作一个转折点。

就像今天回看 2007 年 iPhone 发布、1995 年浏览器诞生——当时在场的人没觉得怎样,事后才懂自己站在了什么位置上。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容