文 | 窄播,作者 | 李威
过去 10 天,大模型新品密集发布,看似竞争激烈,但各方的力量对比却并未有大的改变,整个行业都还处于一种过渡状态。
4 月 24 日,DeepSeek V4 发布成为这轮大模型密集上新的压轴戏。在此之前,OpenAI 和腾讯在 4 月 23 日分别推出了 GPT 5.5 和 Hy3 preview,月之暗面和阿里分别在 4 月 20 日发布了 Kimi K2.6 和 Qwen3.6-Max-Preview,Anthropic 则在 4 月 16 日发布了新模型 Claude Opus 4.7。
大家期盼已久的 DeepSeek V4,并没有像当初 R1 发布时那样带来颠覆性的技术突破。反倒是它对国产芯片的适配能力,成了新模型发布后的第一讨论落点。甚至,这两天还冒出了一种「国产模型默契同行」的积极论调。
但我们更关心的,是 DeepSeek V4 落地之后,牌桌上的力量对比究竟变了多少。
首先,DeepSeek 这次没掀桌,对阿里、腾讯、月之暗面、MiniMax、智谱来说,都算是个好消息。阿里、腾讯此前刚经历大模型团队调整,这下多了些恢复时间;月之暗面也没被 DeepSeek 彻底封死估值空间;MiniMax、智谱还能继续吃上龙虾热带来的收入增长。
其次,格局变化不大的根本原因在于:这一轮发布的模型大多还处于过渡状态,没有掀桌的势能。各家一边发新模型,一边预告更强模型或更高性价比——龙虾才刚亮出潜力,由大模型驱动的 Agent 竞赛,远没到最激烈的时候。
关键的变量,会出现在两个地方:一是谁能率先做出更适配 Agent 范式的研究突破,二是谁能把性价比打到更低。
过渡阶段的产物
这一轮发布有个明显特征:「Preview」(预览版)成了高频词,没人敢喊这是「真正的新一代大模型」。除了都需要更长时间来应对 Agent 爆发这个技术刚需,各个企业自身也都需要做更多准备来迎接真正激烈的竞争。
第三方机构 SemiAnalysis 认为 DeepSeek V4 是「一个特殊的工程版本」,「紧随前沿水平之后」,可以作为美国闭源大模型的低成本替代品。但要真正延续极致性价比,DeepSeek 还需要等待国产芯片超节点批量上市,为其提供充足的高端算力保障,将 Pro 版模型的 API 价格打下来。
月之暗面虽然表示 Kimi K2.6 是目前最好的代码模型,但也提到了 K2.6 是为 K3 准备的起飞跑道。从数据上看,Kimi K2.6 是一个万亿参数的 MoE 多模态模型,32B 激活参数,256K 上下文。相比之下,Gemini、Qwen 和 DeepSeek 都已经开始支持百万级的超长上下文。
腾讯的 Hy3 preview 总参数 295B,激活参数 21B,最大支持 256K 上下文长度。腾讯首席 AI 科学家姚顺雨将其称为混元大模型重建的第一步,期望「获得来自开源社区和用户的真实反馈,帮助提升 Hy3 正式版的实用性。」也就是说,雷峰网消息报道的将在五六月份发布的 Hy3 闭源旗舰版本,可能才是姚顺雨真正要交的卷。
阿里的 Qwen3.6-Max-Preview 也被描述成新一代千问旗舰模型的早期预览版,还在积极开发,持续迭代。阿里在林俊旸风波之后获得广泛关注的视频模型 HappyHorse 与世界模型 HappyOyster,都出自刚被划归 ATH 事业群的原淘天集团未来生活实验室,而经历大变动的基础模型团队还没有拿出能证明自己的模型。
在海外,Anthropic 在 Claude Opus 4.7 之外,还有一个据说很强的 Mythos;GPT 5.5 也没有被行业看作是一个划时代的产品。
服务 Agent 是新阶段的核心
小米大模型团队负责人罗福莉一直在强调,大模型技术正处于从 Chat 到 Agent 范式的快速转变过程中。小米此前发布的旗舰基座模型 Xiaomi MiMo-V2-Pro,以及全模态基座模型 Xiaomi MiMo-V2-Omni 和语音合成模型 Xiaomi MiMo-V2-TTS,被她称作是为 Agent 时代打造的首个全栈模型家族。
在 DeepSeek 和月之暗面发布的信息中,也都在强调新模型对 Agent 能力的强化。DeepSeek V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品进行了专项适配和优化。Kimi K2.6 引入 Agent 集群架构,支持 300 个子 Agent 并行协作。
这些技术也在 DeepSeek 和月之暗面的工作中得到了检验。DeepSeek 内部员工已经把 DeepSeek V4 Pro 当作日常 Agentic Coding 工具使用,交付质量接近 Claude Opus 4.6 非思考模式。月之暗面的 RL 基础设施团队用 Kimi K2.6 驱动的 Agent 在负责监控、故障响应和系统运维,能连续运行 5 天。
未来的模型竞争是围绕服务 Agent 进行的。相比 Chat 阶段,强调真正交付结果的 Agent 阶段,会让好模型的价值迅速膨胀。
这种膨胀目前已经体现在大模型公司的收入增长上。智谱经历了多次涨价,但市场需求依然供不应求,调用量增长了 400%。Kimi K2.5 上线 20 天的收入已经超过了月之暗面 2025 年的全年收入。Anthropic 的 ARR(年度经常性收入)也来到了 300 亿美元。这种增长也推高了大模型公司的市值或估值。
罗福莉在接受张小珺访谈时表示,接下来两三个月会非常精彩。她认为,在 Agent 范式阶段,大家都处在同一起跑线上。接下来,团队的研究水平、技术敏捷度,以及拥抱新范式的能力,将决定谁能跑出来——现在怎么决策,很可能就决定了半年后哪个模型更领先。
性价比会带来更大空间
从大的竞争层面来看,美国的闭源模型依然处于领先地位,DeepSeek、月之暗面的比较对象,都不是 OpenAI 和 Anthropic 的最新模型。但中美大模型之间也并未拉开断层式的差距。这就让中国大模型有可能用性价比争取更大的发展空间——用很便宜的价格达到美国闭源大模型 90% 的性能。
目前,DeepSeek 新一代模型的最贵价格是每百万 token 输入价格 12 元(缓存命中 1 元),输出价格 24 元;Kimi K2.6 的价格是每百万 token 输入价格 6.5 元(缓存命中 1.1 元),输出价格 27 元。即便较前代模型有所上涨,也仍然远低于 GPT-5.5 的每百万 token 输出 30 美元的定价。而且,这种价格优势还有可能在国产芯片的加持下被进一步放大。
对于有充足资源使用欧美顶尖闭源模型的用户而言,他们需要衡量模型的 API 价格与其所能替代的生产力价值。
这就像 C 端用户购买大模型产品的会员,不是花钱越多、性能越高,就越适合自己。最高档位往往对应最强的功能,但大部分人都用不到这么强的功能。同样,欧美用户在购买模型 API 时,更多会考虑性价比。这就是中国大模型正在获取的机会空间。
还有一个机会场景是没能力使用欧美顶尖闭源模型,甚至也没能力购买英伟达顶尖芯片的用户。
中国模型 + 中国芯片的组合可能会是更好的选择。DeepSeek 之外,月之暗面也提出了跨数据中心异构硬件推理框架,让国产芯片可以介入到推理过程中。未来,AI 的应用会像互联网一样从欧美、东亚普及向东南亚、非洲、拉美。这是一个巨大的机会空间。
微软在 2026 年 1 月发布的一份报告中认为,DeepSeek 推动了整个发展中国家更广泛的使用 AI。报告估计,DeepSeek 在俄罗斯、白俄罗斯、古巴、叙利亚、伊朗、埃塞俄比亚、津巴布韦、乌干达、尼日尔等国家,都占有双位数的市场份额。「开放性和可负担性的结合使 DeepSeek 在西方 AI 产品服务不足的市场中获得了牵引力。」
回到我们开头的问题,牌桌上的力量对比目前并没有发生变化,但牌桌之下,各方的角力早已开始。并且这种角力不再像 Chat 阶段那样是纯粹技术能力的比拼,而是开始涉及到更多技术之外的模式、体系的竞争。这是不同量级的较量,需要更多时间准备。这也是 DeepSeek、月之暗面更积极进行资本运作的原因。
当这些角力开始浮上水面时,才是行业格局真正改变的时刻。