
作者 | 董必政
编辑 | 丁萍
头图 | 视觉中国
100 亿美元、450 亿美元、515 亿美元。
23 天里,DeepSeek 估值涨了接近 5 倍。根据 The Information 报道,DeepSeek 本轮融资金额高达 500 亿元人民币,创始人梁文锋或自投 200 亿元,占整轮约 40%。
这件事真正值得看的,不是 DeepSeek 值多少钱,而是它开始回答另一个问题:一家原本强调 " 不融资、不商业化、不路演 " 的公司,一旦开始融资、定价、考虑退出,它改写的就不只是自己的路径,而是整个大模型行业的估值逻辑。
因为 DeepSeek 一旦进入商业化和 IPO 叙事,市场就不得不重新审视一件事:大模型公司到底有没有持续提价权。
这才是它对行业最深的冲击。
一、DeepSeek 为什么必须商业化?
表面看,DeepSeek 融资是为了补算力、补基础设施、补人才;本质上,它是从 " 科研组织 " 切换成 " 公司组织 "。
这背后有三笔账,绕不过去。
第一笔是人才账。
过去,DeepSeek 可以靠技术理想和组织气质留人;但在大模型行业进入高强度挖人阶段后,愿景已经不够了。真正能留住核心人才的,是定价体系、期权预期和退出通道。
不定价,就很难给出有约束力的股权激励;没有退出预期,组织稳定性就会被削弱。对 DeepSeek 来说,融资不是单纯缺钱,而是公司治理走到了必须资本化的一步。
第二笔是扩张账。
大模型公司烧钱的从来不只是算力。产品化、交付、销售、生态建设,都是后续更重的投入。模型能力可以带来声量,但不能自动变成收入。DeepSeek 如果要从 " 能力很强的模型公司 " 变成真正的平台型 AI 公司,就必须把技术变成产品,把产品变成现金流。
第三笔是退出账。
既然引入外部资本,就一定要面对退出。回购不现实,老股转让只能解决局部流动性,真正匹配 DeepSeek 体量和叙事的,只能是 IPO。而 IPO 的前提,从来不是 " 模型很强 ",而是 " 商业化成立 "。
所以,DeepSeek 接下来的关键变化,不是它会不会继续做模型,而是它必须证明技术优势能不能变成持续收入,也就是商业化。
二、薄利多销
这波 " 养龙虾 " 的浪潮,让大模型厂商看到了更清晰的商业化路径。
过去市场对大模型商业化的最大质疑在于,模型能力越来越强,但谁来付费、为哪种价值付费、付费能否覆盖成本,这些问题始终没有真正解决。
而 OpenClaw 等改变了这套叙事。
因为用户买的不再只是一次性问答,而是一个持续工作的数字劳动力。而 Token 消耗就不再只是 " 聊天成本 ",而变成了企业愿意为效率提升买单的生产成本。
近期多家厂商开始结束免费公测、转向正式商用按量计费,甚至释放涨价信号。
关键的是,市场已经开始接受高质量 Token 的收费权,而不是 " 谁涨了多少价 "。这比单纯的调用量增长更重要。
例如:2 月 12 日智谱发布 GLM-5 时上调 Coding Plan 套餐价格 30% 起,3 月 16 日发布 GLM-5-Turbo 时再涨 20%,相对 GLM-4.7 累计涨幅达 83%。即便如此,市场依然供不应求,调用量增长 400%。
以前,DeepSeek 的商业化极低(只提供 API 调用),给各大模型厂商错位竞争的提价空间,比如:Coding Plan 服务等。
然而,DeepSeek 这次融资后也将商业化,但想让用户进入 " 普惠时代 "。

此外,妙投梳理 Deep Seek 的招聘信息发现,Deep Seek 发布了 7 个模型策略产品经理的细分方向(搜索评估、搜索回复、多模态、安全、文艺 / 功能写作、Agent),试图勾勒出从技术能力到商业落地的转化路径。
这与市面上的大模型厂商的大部分应用场景较为重合,意味着 Coding Plan 服务这类产品有可能从 " 涨价 " 回到 " 普惠 "。
此外,据 DeepSeek 官方信息,受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 价格会大幅下调。
| 厂商 | 最新主力模型 | 总参数 | 激活参数 | 上下文 | 输入价 | 缓存命中 | 输出价 |
|---|---|---|---|---|---|---|---|
| DeepSeek | V4-Flash | 284B | 13B | 1M / 384K out | 1 元 | 0.2 元 | 2 元 |
| Deep Seek | V4-Pro | 1.6T | 49B | 1M / 384K out | 12 元 | 1 元 | 24 元 |
| Kimi | Kimi K2.6 | 1T | 32B | 256K | 约 6.9 元 | 约 1.16 元 | 约 29 元 |
| 智谱 / Z.AI | GLM-5.1 | 744B | 40B | 约 200K | 0-32K 6 元;32K-200K 8 元 | 有缓存折扣 | 0-32K 24 元;32K-200K 28 元 |
| MiniMax | MiniMax-M2.7 | 230B | 10B | 204.8K | 2.1 元 | 命中缓存 10% 折扣 | 8.4 元 |
| 阿里 / Qwen | Qwen3.6-Plus | 未公开 | 未公开 | 1M | ≤ 256K 2 元;256K-1M 8 元 | 支持上下文缓存折扣 | ≤ 256K 12 元;256K-1M 48 元 |
| 小米 | MiMo-V2-Pro | >1T | 42B | 1M / 131K out | ≤ 256K 约 7.25 元;256K-1M 约 14.5 元 | ≤ 256K 约 1.45 元;256K-1M 约 2.9 元 | ≤ 256K 约 21.75 元;256K-1M 约 43.5 元 |
(数据来源:各公司官网)
对比现阶段各大模型厂商的服务价格,考虑 DeepSeek-Pro 后续还有降价的可能,DeepSeek 将让其他大模型厂商面临 " 不敢提价 " 的境地。
因为 DeepSeek 的低价,不只是一个销售策略,而可能成为整个行业新的价格锚。它会逼同行面对一个现实:模型升级未必带来提价,反而可能带来降价。
而一旦这个预期成立,整个行业此前建立在 " 能力提升—单价提升—收入提升 " 之上的增长叙事,就会被打断。
因此,妙投认为,DeepSeek 商业化最危险的地方不在于它会抢多少客户;而是重新定义了大模型不是一门靠技术溢价赚钱的生意,最终会回到规模、成本和交付效率的生意。
三、溢价要靠业绩支撑了
商业模式的回归,必然引发估值逻辑的变化。
4 月 24 日 DeepSeek V4 发布后,MiniMax 股价从 1330 港元的历史高点腰斩;智谱也在单日大跌 9% 后跌破千元大关。
高盛等机构将这种剧烈反应归因于,V4 系列 API 定出的 " 白菜价 ",直接打破了智谱等通过连续提价改善盈利的预期逻辑,迫使整个行业面临重估 token 价值的压力。
当前,资本市场对智谱和 MiniMax 的实操估值高度依赖市销率(P/S)与 ARR(年度经常性收入)倍数。
例如:若以 2026 年 2 月 Minimax 的 ARR(年度经常性收入)1.5 亿美元为基准,市场给予其约 200 倍的市销率。
这给的估值本身就很高,需要未来几年爆发式的业绩增长才能消化。
而 DeepSeek 恰恰制造了最大不确定性就是,模型升级不仅可以提价,更可以大幅降价。这将直接影响到 Minimax、智谱 " 量价齐升 " 的成长逻辑。
部分投资者也需要看到,智谱和 MiniMax 在市值暴涨 5-8 倍后,它们的定价因子中可能已寄予了过高的增长弹性预期,所以短线波动更剧烈。
不仅仅是成长性,资本市场对其因稀缺性产生的 " 溢价 " 也会有担忧。
智谱和 MiniMax 是目前全球唯二的纯前沿 AI 大模型上市公司,稀缺性是估值溢价的重要来源之一。
但这个窗口不会永远开着。
商业化之后,DeepSeek 为了留住核心人才,大概率是会上市的。此外,Kimi、阶跃星辰等均有上市计划。更多标的上市将分散资金对智谱、MiniMax 的聚焦,其 " 溢价 " 将被打折扣。
此外,一旦 DeepSeek 以 515 亿美元估值完成融资并获得国家队背书,其在资本叙事中的 " 必买 " 地位将固化,进一步压缩智谱、MiniMax 的估值弹性。
短期看,Minimax、智谱靠 token 提价的增长预期面临 DeepSeek 的压力;中期来看,Minimax、智谱因稀缺带来 " 估值溢价 " 也将被打折扣。剩下的,Minimax、智谱只能靠业绩来证明其成长性。
在新的业绩指引出来之前,妙投认为 Minimax、智谱的估值将受到压制,而这个扰动因素就是 DeepSeek。
DeepSeek 商业化真正的杀伤力,不一定是先抢走谁的市场,而是先改写所有人的估值。
