文 | 海豚研究
2026 年 1 月 2 日,壁仞科技在港交所敲钟:发行顶格定价 19.60 港元;开盘股价飙升 +82.14%,盘中一度市值突破千亿港元,收盘市值约 825 亿港元;公开认购超额达 2,347 倍,散户热情火爆。
火爆行情离不开其作为首家港股上市 GPU 公司的稀缺性," 国产 NVIDIA" 的标签更让其成为资本追捧的香饽饽。但抛开这些光环,我们关心壁仞究竟是否是一家优质的公司?
1. 历程:在实体清单上长出来的公司
要理解壁仞,必须梳理其发展历程,其历程本身就是国产芯片行业的 " 辛酸史 "。


有叙事、有人才、有愿景且具备稀缺性(彼时摩尔线程、沐曦集成尚未创立),自然不乏资金追捧。在 2019-2021 年间,公司共完成了 7 轮融资,累计金额 47 亿元,B 轮投后估值超过 110 亿元。


在四个月后的 2023 年 1 月,壁仞突然实现了 BR106 的量产,该型号是从哪儿来的?海豚君推测 BR106 是壁仞为绕开新规而 " 降规 " 迭代的 BR104,初期大概率仍由台积电生产,但被实体清单后生产转至国内。
备注:2023 年 10 月壁仞被定向封锁,BIS 把它和另外 12 家中国实体列入出口管制实体清单,并加挂 " 脚注 4",也就是代工厂要给这些客户交付产品,必须先得到许可证。TSMC 代工通道彻底关闭。


重新恢复节奏已经是 2024 年的事情。其中 BR 166,当下 100 系产品中强算力的双芯配置,也是当下的收入主力,是 2025 年 8 月才开始量产的。
目前 BR100 产品系下有三款产品,单芯 BR106,双芯 BR166(收入主力),以及 IoT 芯片 BR110。整体这三款产品其实都是 2022 年研发的产品。

那么,在新叙事强力加持下,摩尔线程、沐曦登陆科创板,壁仞、天数智芯登陆港股,剩下燧原科技同样上市在即。那么在国产芯价值重估当中,壁仞在一众同行中有什么不同,能吃多久的行业红利,未来的核心看点又在哪里?我们接着分析。
2. 中短期:" 出货 " 为王
目前,国产芯业绩其实逻辑很简单:供给为王。谁能芯片规模出货,谁就能拿到云资本开支的预算。因为英伟达在中国 GPU 市场从几乎 100% 的市占率光速接近清空、AI 走到 Agent 时代又进一步引爆了需求,这中间留下的供需错配太大。
按照海豚君的粗略核算,这个供需差距可能要到 2028-2029 年,才有可能逐步弥合上。29 年之后才会进入需求为主的时代。26 年的需求缺口应该是 40-50% 上下。

国产 GPU 的单核性能弱是共识,普遍落后 NVIDIA/AMD 一至两代,国内常见的方案是通过各种层级(Die-Die/GPU-GPU)的数量堆叠、互联来弥补差距,但难以从根本上消除与海外晶圆厂之间的工艺差距。目前,国产 AI GPU 的上游仍在诸如光刻、EDA 等方面存在限制:
- EDA:国产 EDA 龙头华大九天国内份额约 15.7%,但全球份额仅为 2-3%,且尚未提供数字 IC 全流程的套件;叠加美国对华出口 EDA 软件中的高端制程(7nm 及以下)实施严格管制。
- 光刻设备:国内仍然依赖 ASML DUV 进口,2025 年中国加速采购以对冲管制升级,而 EUV 出口管制始终是最关键的卡点;
- 代工:因设备限制,国内先进制程(N+2:7nm;N+3:5nm)是稀缺产能。目前国内先进产能的能力主要是在中芯国际,多数国产 GPU 设计厂都是排队等中芯的产能。另外一家是华虹半导体,但只是小规模量产,良率和产能有待验证。
由于产能受限,部分 GPU 厂商只能被迫选择 N+1 产线(初代 7nm),但芯片性能与制程先进性高度相关,这也是产能受限下的无奈之举。
因此代工厂能拿出多少的供货,海豚君按 " 晶圆产能 → AI 产能分配 → 制造良率 → 单片裸晶数 → 封装良率 → Die 总供给 " 来做粗略估算。
2)需求:AI 代理需求爆发
需求端看,由于 AI 逻辑芯片进口实质受限,国产替代成刚需。但由于目前国内产品还很难满足训练需求,因此这里主要只是核算推理端的芯片需求。
a ) 以阿里、字节、腾讯为代表的互联网巨头;
b)以 DeepSeek、MiniMax、智谱等为代表的基础模型研发企业;因为需要一直不停消耗 Token,单一需求量太大,有绕过云厂商直接提需求的权利。
以上厂商主要受益于推理需求的结构性上升,领先厂商的基础模型已将日均 token 消耗推至超十万亿。该部分是需求的主力军。
c ) 电信运营商、国企与地方政府等主权 AI 玩家,需求主要来自国家 AI 基础设施建设、数据主权、算力中心与公共部门应用。
市场需求基于国内 AI 开支规划,沿 " 客户 AI/ 云 Capex → 剔除 CSP 海外支出 → × 服务器占比 × AI 服务器占比 × 加速器组件占比 → AI GPU 金额 TAM → /ASP/ 算力 反推卡数→ GPU Die 个数 → CPU/GPU 个数比→ CPU Die 个数 → Die 总需求 " 逐级推导。
总体估算下来,26 年大约需要 420 万颗的 AI 芯片需求,但 26 年供给只有 260 万的供给,差距肉眼可见。

要判断壁仞短期业绩的释放爆发力,本质是分析它否能够锁定足量产能支撑起规模化出货。根据调研,在代工产能受限的当前阶段,代工产能其实是大锅饭的 " 配额制 ":对具备成长性的厂商给予适度倾斜,避免产能在限额分配中过度向单一头部集中。
而海豚君分析后认为,当下这种计划配额制对壁仞相对二线能力(下文会具体分析为何二线)的芯片商而言,反而是好事。因为配额制分配会更加侧重战略分配,而非完全市场化定价方式。
1)获得配额的基本门槛:通关
在配额分配中,目前的硬性标准非常看重从模型一发布就能适配,考察的是软件能力。我们观察到国产 AI 芯片企业正与国产 AI 模型公司紧密合作,主动实现 Day0/ 深度适配大模型工作。


- 主权资金方面,海光 / 寒武纪都有强势的国资(中央)背景,有望优先受益于中芯国际的先进产能(最高优先级仍是华为);而上海地方同时扶植了壁仞 / 沐曦 / 燧原三家本地厂商,壁仞并非 " 独宠 "。

虽然没有独特的 " 深厚关系 ",获取肯定还是能拿到的,毕竟:
其一,对于地方而言,各家厂商手心手背都是肉、难以偏废,其介入本就会使二线厂商有望获得优于纯市场化结果的产能份额。
其二,华虹国际(上海市国资委 ( 51.59% ) 、上海国盛 ( 18.36% ) 、上海国际集团 ( 18.36% ) 、上海仪电 ( 11.69% ) )以 " 现有少数股东的紧密联系人 " 身份出现在壁仞的配售名单中(尽管份额仅 0.13%),也就是说晶圆厂就是它的股东。
而调研也证明,壁仞已经开始接触除中芯国际以外的晶圆厂,并准备了两套产品方案。我们认为随着华虹 7nm 逐步投产,壁仞将随着华虹的产能释放逐步获得晶圆供应。
2)为什么良率可能成为制约?
尽管存在上述利好,难改中芯国际(先进产能的大头)的排产优先级并不面向壁仞的事实,我们判断未来产品主要的供应仍将来自华虹,但华虹的先进制程目前仍处于投产初期,产能有待爬坡。
该工艺通过 DUV 多重曝光实现,而非 EUV,这将导致芯片的良率与能效相对偏低,进而拖累出货能力,是短期最关键的风险点。
4. 长期:壁仞长线能跑赢吗?
进入长期,比拼的就是各家厂商的产品力,产品力的维度目前来说分为三个大的维度:
a. 单芯能力:基础参数、迭代速度;
b. 芯片软、硬结合与生态能力;
c. 系统级方案的交付能力。
目前国内玩家中,除了海思有比较强的系统化交付产品和能力,其他都还集中在芯片这个单一问题上。单看壁仞:
1)基于 GPGPU 的硬件系统;
2)软件平台 BIRENSUPA;

主流的 AI 智算芯片类型上,有 ASIC、FPGA 与 GPGPU 三种路径。公司主营自研 GPGPU 芯片、加速卡、整机服务器,采用 Fabless 模式,将晶圆制造和封装测试外包给第三方代工厂。



BR166 其实就是 BR106 的双芯版,算力翻倍,架构其实不变,而 BR106 的原本架构就是 2022 年的 BR100。
按招股书所说,「我们利用芯粒技术将两个 BR106 裸晶和四个 DRAM 集成到一个封装中…两颗 BR106 裸晶之间的 D2D ( 裸晶间 ) 双向带宽可高达 896GB/s。」架构(下图为 BR100 架构,BR166 除内存披露为 DRAM 外延续此架构)如下所示:

微架构设计上,我们知道 SM 是 NVIDIA 的基本调度粒度,类似壁仞的 SPC 下还有更小的 EU 单元,支持对 4/8/16 EU 的动态调度粒度组合,可以根据工作负载特性在更细粒度上做资源复用。
算力(矩阵吞吐量)上,每个 EU 配置 1 个 T-Core(1 SPC 有 16 个 T-Core 并行计算);Hopper 架构下单 SM 是 4 个 Tensor-core;这个是更适合国产良率下 Chiplet 的方案。

在国内同行中,由于 BR100 是 2022 年的产品,单芯算力还算可以,主要在片间互连、显存带宽与容量、计算精度等方面已被友商赶超,其中昇腾 910C 基本对标 H100,而沐曦 / 燧原的产品综合性能已经介于 H100-H200 之间,BR166 的产品力已略显不足。



- 在手订单:据招股书披露,其框架销售协议及销售合同中未完成的、具约束力订单总价值达 8.22 亿元,为后续收入提供确定性基础。
- 合同负债:2025 年末合同负债达 0.77 亿元,已有客户以预付方式锁定订单。
- 存货:2025 年末存货净额达 9.49 亿元、同比增长超 500%,且结构上以原材料(3.86 亿元)与在制品(4.31 亿元)合计占比约 85%,表明存货扩张源于确定订单。

BR166 综合竞争力不突出,但站在 2026 年的节点上,按照 3-4 年产品大迭代一次来看。新一代旗舰产品 BR 20X 系产品推出在即。节奏上:
( 1 ) . BR20X 系列:目前正在进行物理设计及流片验证,计划 2026 年四季度开启商业化。公司将在提升单芯片能力的同时加快推进超节点系统。
( 2 ) . 产品参数:作为供应链完全转向国内而免受管制的下一代旗舰产品,演进方向上符合我们预期:
- FP8&FP4 将在 BR20X 系列配备,加速公司适配大模型训练推理需求;
- 提供更强的算力;
- 配备更大更快的内存、更高速的互联带宽及超节点系统设计。
具体规格上,我们估计 BR20X 将对标 NVIDIA H200,具体参数没有公开信息。海豚君以参考对标的产品以及调研信息,对 BR20X 估计如下:

2)软件平台 BIRENSUPA
如果说硬件方面,各大芯片设计厂商正在尝试各种方案缩小与 NVIDIA 的代差,那在软件方面,CUDA 就是所有厂商都无法绕开的一堵高墙。CUDA 的壁垒不必过多赘述:先发优势积累的护城河、软硬件深度绑定带来极致性能优化与软件兼容、丰富的工具库等。
国内厂商的应对大体分两条路线。一是采取兼容 CUDA 的模式,如摩尔线程的 MUSA/ 沐曦的 MACA,他们都以此作为商业化的卖点。二是以华为 CANN/ 寒武纪 Neuware 为代表的全栈自研,前者通过超 5 年的算子积累深度绑定了主权订单,后者在推荐系统场景垂直深耕,收获字节等头部 CSP 的锁定。壁仞创立之初也计划走自研生态。


短期来看,壁仞由自研生态转向兼容的取舍是合理的,其规模体量 / 客户结构 / 商业化能力都无法支撑其继续埋头走自研道路。毕竟对于客户而言,最终评判核心是解决方案的性价比,这是一个软硬件结合的体现。
但站在更长期视角,兼容本质上并不能带来竞争壁垒,乐观的推演下是壁仞作为中间层做得比其他厂商更具优势,但如果壁仞不能在软件易用性、稳定性和第三方生态建设上建立差异化,可能很快就会陷入同质化竞争。
3)超节点:有方案吗?
壁仞的产品以 GPU 集群 / 超节点为交付形式,但其在交付方案中的价值量仅在于 GPU 环节,互连、交换、整机集成的价值量让渡予曦智、中兴等上下游伙伴。
行业,国产厂商除华为已实现了全栈自研,多数在互连通信的自研布局上仍处于起步阶段(仅在卡间互连协议实现自研),在交换芯片(对标 NVSwitch)、整机柜系统集成环节多与上下游厂商合作。
而目前各家的研发重心放在了算力芯片、软件栈之上,互连尚未形成差异化竞争。但互连技术在 AI 时代的价值被显著放大,Scale-up/out/across 能力将决定单节点能够承载的模型体量。
我们认为能够率先 " 交钥匙 " 的公司将利于自身长期生态壁垒的构建,壁仞与创业公司同行没有本质差异。

但它好的地方在于,在 " 产能配额 " 模式下,它具备种子选手,持续被政策扶持的实力,本身能够港股上市,其实也是一种官方背书的体现。而且短期来看,BR 20X 商业化在即,也能为接下来的业绩释放提供非常好的接力棒。