" 卖 Token 也能上市?" AI 圈最近又炸出一个新物种。
6 月 30 日,硅基流动向港交所递表,剑指 "Token 工厂第一股 "。
文 | 世界模型工场
这家成立不到三年的公司,讲出了一个全新的故事:不做大模型、不做 AI 应用,专门做 AI 产业的 "Token 批发商 "。
具体来说,就是把英伟达、华为昇腾等不同芯片的算力,和 DeepSeek、Qwen、GLM 等上百个模型,统一封装成标准化的 Token 服务,用户按调用量付费,不用关心底层用的什么芯片、什么模型。
听起来很美,资本也很买账。
34 个月里,硅基流动完成 7 轮融资,估值从天使轮 2.3 亿元的投前估值,一路飙到最新 B+ 轮 77.4 亿元的投后估值,涨了 33 倍。
阿里、华为、美团、商汤……半条 AI 产业链都挤进来当股东,阵容豪华得晃眼。
但翻开招股书,画风就不一样了。
2025 年营收 5533 万元,同比增长 653%,可净亏损也达到 3.45 亿元,是收入的 6 倍多。
更扎心的是毛利率,直接干到了 -24%,相当于每赚 1 块钱,还要倒贴 2 毛 4。
一边是资本热捧、估值飞天,一边是越卖越亏、毛利率转负。
硅基流动这门 "Token 生意 ",到底是 AI 时代的水电煤,还是又一个烧钱换规模的资本游戏?

硅基流动的爆红,得从一个人和一件事说起。
第一个人是创始人袁进辉。
这位清华计算机系博士,师从中国 AI 奠基人张钹院士,是 AI Infra 圈里实打实的 " 技术老兵 "。
2008 年毕业后,他进了微软亚洲研究院当主管研究员,搞出了当时世界最快的主题模型训练算法 LightLDA,还拿过微软亚研院院长特别奖。
2016 年,袁进辉从微软离职创业,搞出了深度学习框架 OneFlow,在分布式训练领域一度是国产之光。
2023 年,OneFlow 被王慧文的 " 光年之外 " 收购,后来又跟着并入美团。
但袁进辉拒绝了美团的留任邀请,带着核心团队二次创业,硅基流动就这样诞生了。
第二件事,是 2025 年春节的那场 DeepSeek 狂欢。
DeepSeek R1 横空出世,全网都在抢着用,算力直接崩了。
硅基流动联手华为云昇腾,首发了国产化部署方案,一夜之间接住了汹涌的流量,上线仅 10 小时就被迫限流。
这场爆红,让硅基流动一战成名,也坐实了 " 中国最大独立 Token 供应商 " 的名头。
这个定位确实踩中了风口。
招股书援引弗若斯特沙利文的数据,2025 年中国词元按吞吐量统计,市场前三名合计拿下约 87% 的份额,硅基流动排第四,市场份额约为 1.5%。
别小看这 1.5%。
从描述看,外界可以推测对应的前三名分别是火山引擎、阿里云、百度智能云。
硅基流动作为一家创业公司能在巨头夹缝里啃下一块肉,已经相当不容易。
运营数据也确实亮眼:
截至 2026 年 4 月,平台注册用户超过 1000 万,日均 Token 吞吐量达到 5785 亿次;
公有云付费客户从 2024 年的 2455 家,飙升到 2025 年的 71.6 万家,一年涨了约 292 倍。
这大概就是资本愿意给 77 亿估值的底气。
但问题来了:140 倍的 PS(市销率),到底贵不贵?
对比一下就知道了。
海外同类玩家 Fireworks AI,2025 年 10 月 C 轮融资时估值 40 亿美元,对应 ARR 约 2.8 亿美元,PS 约 14 倍。
Together AI 刚官宣了一笔 8 亿美元的 C 轮融资,估值直接翻倍到 83 亿美元,对应今年初约 10 亿美元的年化收入,PS 约 8 倍。
两家海外对标公司的 PS 都在 10 到 15 倍区间,硅基流动 140 倍的估值,是它们的近 10 倍。
这多出来的溢价,市场到底在赌什么?
两条业务线,根都不牢
硅基流动有两条业务线,命运天差地别。
第一条是公有云服务,也就是大家说的 MaaS,这是 "Token 工厂 " 故事的主角。
2025 年,这条线贡献了 2926 万元营收,占总收入 52.9%,首次超过另一块业务。
但它有个致命问题:不赚钱,毛利率是 -119%。
也就是说,每收入 1 块钱,硅基流动要倒贴 1 块 1 毛 9,卖得越多,亏得越狠。
很多人第一反应是 " 烧钱换客户 ",毕竟 2025 年光免费代金券就烧了 5400 多万元。
但这只是表象,更深层的问题是:公有云业务从商业模式上就很难赚钱。
先看价格。
硅基流动上 DeepSeek-V3 的常规价格一度是输入 2 元 / 百万 Token、输出 8 元 / 百万 Token,R1 是输入 4 元、输出 16 元,加上新用户注册就送 2000 万免费 Token,早期确实比官方便宜三到五成。
但这个优势正在快速缩水:
2026 年 5 月,DeepSeek 将 V4-Pro 的限时 5 折优惠永久化,降幅达 75%,缓存命中的输入价格干到 0.025 元 / 百万 Token,比硅基流动的老价格便宜出几个量级。
原厂一降价,中间商的价格优势就被打薄了。因为硅基流动的成本结构,从根上就不占优势。
对于闭源模型,它拿不到权重,只能通过原厂 API 或授权渠道转接,相当于 " 二道贩子 ",成本理论上不可能比原厂更低。
对于开源模型,它虽然可以自己租卡部署、做推理优化,但原厂有最大规模的调用量、最深的模型理解、最极致的工程优化,单位成本还是比它低。
硅基流动的便宜,更多是靠补贴让一点、靠优化挤一点、靠比客户自建便宜一点,这不是系统性的成本优势。
真要打价格战,原厂降得起,它降不起。
那用户为什么还用它?
早期用户可能冲着便宜,但真正留下来的,更多是冲着多模型统一接入。
170 多个模型随便切,代码几乎不用动,加上智能路由、容灾、成本管控这些企业级功能,省的不是钱,是时间和精力。
问题是,这门 " 省事 " 生意的护城河有多深?
再看客户比例。
招股书披露,2026 年前四个月,公有云付费客户约 64 万家,人均 ARPU 约 22 元,高价值付费客户占比不到 1%。
这说明客户数量被长尾用户快速拉高,但不排除少数大客户贡献了更高的付费金额。
但真正的问题在于,长尾客户天然价格敏感,迁移成本又低,今天你便宜就用你,明天别家更便宜就转走。
而大客户即便付费更多,也更会把价格、稳定性和供应链安全压到极致,议价能力只会更强。
第二条是本地部署解决方案,才是真正的 " 利润奶牛 "。
客户自己有算力,硅基流动把推理引擎和调度系统部署到客户数据中心,收软件许可费、实施费和维保费。
2025 年这项业务营收 2607 万元,占比 47.1%,毛利率高达 82.5%。
看着很美,但隐忧不小。
一是客户越来越集中:
本地部署客户数量从 2024 年的 28 家减少到 2025 年的 20 家,2026 年前四个月更是只新增 5 家;
但平均每客户收益从 22.4 万元暴涨到 130.3 万元,涨了 481%,说明收入越来越依赖少数大客户。
二是规模化有天花板:
本地部署本质是项目制生意,交付周期长、复用率低,更像一家 "AI 工程服务商 ",而不是 "Token 工厂 "。
两条业务线,一个撑估值、一个赚利润,搭配得很精妙。
但 "Token 工厂 " 这个核心故事,其实主要是 2025 年才讲出来的。2024 年,公有云收入才 106.9 万元,本地部署才是绝对主力。
尴尬的是,硅基流动必须继续把 MaaS 这条亏钱的线做大,才能撑住估值故事,可每做大一分,亏损就扩大一分。
想象力和现金流,短期内只能选一个。
" 中立第三方 " 的护城河有多深?
硅基流动最大的卖点,是中立第三方。
大厂云做 MaaS,都是 " 自研模型 + 云生态 " 打包卖,比如豆包之于字节、通义之于阿里。
大模型厂商把推理放在这些云上,总担心调用数据被拿去训练竞品。
硅基流动不做模型、不做应用,只做中间层,恰好解决了这个信任问题。
但这个位置真的稳固吗?
先往上看,硅基流动是纯粹的 " 租卡方 ",对供应链没有话语权。
招股书披露,2025 年公司向前五大供应商合计采购 1.173 亿元,占采购总额 70.8%,最大单一供应商占比 20.4%。
招股书还提到,往绩记录期内有两名主要业务伙伴同时是公司的客户及供应商。
对照股东名单不难猜到,这大概率就是阿里、华为哈勃这类公司。
这些大客户一边通过股权和算力租赁赚硅基流动的钱,一边旗下的云和模型业务又在市场上跟它抢客户,这仗怎么打?
更关键的是,硅基流动没有定价权:
芯片涨价,成本跟着涨;大厂云降价,售价也得跟着降,两头都是别人说了算。
再往下看,硅基流动没有自研模型,对产品同样没有掌控力。
它能卖什么、卖多贵,很大程度取决于开源社区和模型厂商的脸色。
而它最大的卖点 " 多模型统一接入 ",技术门槛并不高。
火山引擎、阿里云、百度智能云都在做模型市场、做统一 API,一旦大厂把开放也做成标配,价格还更低,硅基流动的核心价值随时可能被绕开。
国产芯片厂商也是变量。
昇腾、沐曦、摩尔线程这些芯片,眼下软件栈不够成熟,需要硅基流动这样的中间层做适配。
可万一哪天芯片厂商自己把统一软件栈做出来了,中间层的价值还剩多少?
它的股东名单,其实已经很说明问题。
阿里、华为、美团、商汤、创新工场……一张 AI 产业链地图,里面有些角色,既是股东,又是供应商,还是竞争对手。
对这些产业资本来说,这笔账怎么算都不亏。
自家 MaaS 跑出来了,是主营业务的胜利;" 独立中间层 " 这个物种真跑通了,就通过股权分一杯羹,横竖都不亏。
硅基流动 140 倍 PS 的估值,本质上押注的是一个时间差。
在国产芯片自研软件方案成熟之前、在竞争对手补齐中立能力之前、在大厂把多模型平台做起来之前,先把位置占住。
但时间差是有保质期的。
招股书披露,截至 2025 年末账面现金及现金等价物 1.72 亿元、定期存款 1 亿元;2026 年内公司密集完成 A+、B、B+ 三轮融资,合计融资约 14.8 亿元,七轮累计融资约 19.5 亿元,家底不算薄。
但这笔钱能撑多久,仍取决于公有云亏损能不能尽快收窄。
Token 工厂到底是 AI 时代的水电煤,还是又一个资本催熟的泡沫,答案可能要等下一轮周期才能揭晓。