关于ZAKER Skills 合作
钛媒体 12分钟前

DeepSeek 的 500 亿会花在哪?

文 | 最话 funTalk,作者 | 林书,编辑 | 刘宇翔

DeepSeek 的 Harness 团队在北京海淀区融科资讯中心,十年前我曾在那里工作。这不是想往脸上贴金,而是很遗憾,错过了见证历史的一刻。

6 月 16 日,据媒体报道,DeepSeek 完成了成立以来的首轮外部融资,募集资金超过 500 亿元人民币,投后估值突破 500 亿美元。创始人梁文锋个人出资 200 亿元,为最大单一出资方;腾讯出资 100 亿元,宁德时代体系出资约 50 亿元,京东、网易及 IDG 资本各出资 30 亿元。

这是中国 AI 行业迄今规模最大的单轮融资。

那么,拿到巨额融资的 DeepSeek,会把钱投向哪个方向?

6 月 15 日,从论坛流出的一则信息可能让我们可以管中窥豹。据一位参与测试的用户称,DeepSeek V4.1 在网页端启动灰度测试,他说 V4.1 Flash 的代码能力实现了 " 天差地别 " 的跨越式进步,知识截止日期也从 2025 年 5 月跃升至 2026 年 1 月,部分用户甚至测出了 2026 年 5 月的截止日期。

很可能 AI coding 就是 DeepSeek 即将发力的方向。

其实,5 月,DeepSeek 的一则招聘启事也透露了这点,那则 Agent Harness 研发工程师的招聘启事里,写了一行简洁的公式:Model + Harness = Agent。岗位描述进一步解释道," 把前沿模型能力,转化为领先的 Agent 产品。Harness+ 除模型本身以外的所有工作 "。

AI coding+Agent,看来,DeepSeek 接下来的目标是想对标 Anthropic 旗下的 Claude Code。DeepSeek 做 coding,因为这个领域能用最严格的标准来测试和锻造模型的推理能力,不仅是目前唯一被验证的、能形成商业闭环的场景,更是 AI 生产力的基础设施。

01

DeepSeek 没兴趣在 C 端和豆包、千问、元宝争夺用户。从这轮融资的资金用途、产品布局、人才引进以及市场验证来看,DeepSeek 的战略意图很清晰:服务好开发者和企业,把模型能力转化为生产力工具,成为 AI 时代的 " 基础设施 " 提供商。

虽然 DeepSeek 没有公开资金分配比例,但从其战略意图和行业趋势,可以反推可能的分配比例:

500 亿的大头大概率会砸在算力上,毕竟从长远来看,DeepSeek 始终处在算力边际紧缺的状态,无论是要训练出新一代模型,还是要满足用户调用量的增长。

前段时间,DeepSeek 在内蒙古乌兰察布招聘智算中心人员,岗位有高级运维工程师、高级交付经理,月薪开到 15K 到 30K,还配 14 薪,还设立 "IDC 设计规划工程师 " 岗位,规划 MW 到 GW 级的超大规模智算中心。这说明,DeepSeek 正从租用机房转向大规模自建数据中心。

我们了解到,除了自有算力,早在 2025 年,浙江很多空置的算力中心都给 DeepSeek 调用。即便有外部算力供给,算力依旧是以及会是 DeepSeek 长期要面对的难题,近期其 " 专家模式 " 取消了联网搜索功能,并且限制生成次数,就从侧面说明了这点。

算力是 Coding 基础设施的物理底座。如果 V4.1 的性能提升,调用量增加,以现有算力更难承受。没有算力,V4.1 再强也只能限流,没有算力,Harness 再好用也跑不起来。

可以相比较的是在 coding 领域最强的 Anthropic,它采取 " 多云绑定 + 专属集群 " 的激进策略,已构建覆盖 GPU、TPU 及自研芯片的多元供应网络,2025 年底可用算力约 1.4 吉瓦,预计 2026 年底将快速提升至 7-8 吉瓦区间。但仅 2026 年第一季度其收入与使用量按年化计算就增长 80 倍,远超原有基础设施承载能力,导致服务曾出现限流与性能波动。

Anthropic CEO 达里奥 · 阿莫迪表示算力需求呈指数级爆发,公司正全力建设以匹配这一 " 疯狂 " 增速,目标是在未来几年内实现吉瓦级容量的持续释放。

AI Infra(基础设施)是一项重资产、长周期的投入,DeepSeek 还在高速发展,理论上,它完全可以租用更多算力,为什么要自己费力为处理海量、复杂的 B 端 AI 工作负载提供稳定、低成本的算力底座呢?

因为DeepSeek 的技术路线,决定了它必须拥有 Infra 的绝对控制权,必须在 Infra 层就做优化。

为了尽量压榨算力,DeepSeek 做 FP8 训练,需要写通信库、调精度补偿策略、改 NCCL,英伟达原生的通信库不支持这种级别的自定义;DeepSeek 自己重新设计 KV Cache 的存储和调度,因为标准推理引擎(vLLM、TensorRT-LLM)的架构假设和它要的不一样;DeepSeek 要设计 MoE 负载均衡,自己写路由算法,让专家分布在特定的节点拓扑上,减少跨机通信,而不能简单用云厂商的 Kubernetes 自动扩缩容。等等。

这些都需要在 " 算法 - 芯片 - 网络 - 框架 " 的每一层做定制优化,云厂商的标准化服务满足不了。Anthropic 能继续堆参数、超大规模路线,是因为它有亚马逊云和 Google Cloud 的可 " 无限扩容 " 算力支持,用不着在 Infra 层面做极致优化。

DeepSeek 没有这个条件,所以只能自己做地基,但这些努力也正是 DeepSeek 的竞争力来源。

这些优化不是孤立的,而是乘法关系。从公开的技术架构差异和行业成本模型,架构优化 × 精度优化 × Infra 优化 × 推理优化叠加,使得 DeepSeek 的单位算力成本比 Anthropic 的低得多。

02

算力是地基。地基之上,DeepSeek 另两个大投入方向是模型层和执行层。

6 月 15 日那则 V4.1 灰度测试的帖子,透露的是 DeepSeek 在 coding 领域的进展。据参与测试的用户称,V4.1 Flash 的代码能力实现了 " 天差地别 " 的跨越式进步。但我们没能参与灰度测试,目前并不了解具体实际情况。

DeepSeek V4 曾以 1.6T 总参数、1M 上下文窗口,在架构效率和成本结构上实现了全面突破。但 V4 的 Coding 能力与业界顶尖水平仍有差距,这也是社区讨论最多的短板。V4.1 的核心任务,正是开始补齐这块短板。

从序列号来看,V4.1 是 V4 的增量版本,这意味着 V4.1 的核心投入在后训练阶段(Post-Training),而非预训练(Pre-training),后训练成本通常只有预训练的 1/10 到 1/5。

DeepSeek 朝生产力演进的方向已经很明确的,而这正是国内大模型企业与国际最高水平对比最大也是最紧迫的短板。

如果把 AI 模型比作大脑,Agent/Harness 这个执行层就是它的手脚和神经系统。没有执行层,大脑只能思考;有了执行层,大脑才能行动。过去一年,行业已经证明了一个事实:模型能写代码,不等于能持续完成一个工程任务。真正改变开发者工作方式的,是 Claude Code、Codex,一个能够进入终端、理解项目、读写文件、运行命令、修复错误、管理 Git、调用工具的工程智能体。

Coding 是 Harness 的最佳载体,因为代码本身就是可执行的意图,一行代码既是对问题的描述,也是对解决方案的精确指令。

Anthropic 是最早把 " 模型写代码 " 升级为 " 模型做工程 " 的公司。2024 年推出的 Claude Code(以及此前的 Claude Dev、Artifacts 等功能),不是简单的代码补全工具,而是一个完整的终端工程环境。Claude Code 的火爆证明了一件事:AI Coding 的竞争,正在从模型能力竞争,转向开发者工作流入口竞争。

模型是大脑,但大脑不能自己打字,你需要一套系统,把模型的意图转化为行动。那就是 Harness。

Anthropic 的 AI coding 端到端工程闭环的体验,是模型能力 +Harness 工程的双重积累。 Anthropic 比竞争对手早 6-12 个月跑通了这个闭环,形成了开发者习惯壁垒。当 DeepSeek 还在做模型层时,Anthropic 已经在做工作流层了。

这种领先不只是无限算力加持下超大规模模型的能力输出,也是工程打磨的结果,这需要大量产品工程师、开发者体验设计师、DevOps 专家的反复迭代。

所以,DeepSeek 在推进 V4.1 乃至 V5 的研发的同时,也在补足 Agent/Harness 能力。5 月那则招聘启事里的公式,Model + Harness = Agent,说的就是这个。

据媒体报道,DeepSeek Harness 团队的负责人是崔添翼,一位在 Jane Street 干了 9 年、后来联创量化基金 TSY Capital 的交易系统专家。2026 年 2 月,他离开 TSY Capital 加入 DeepSeek。DeepSeek 找他来,正是为了搭建 Harness。

DeepSeek 找了一个做量化交易系统的人来搭建 Harness。这个选择背后的逻辑,比 " 同行相惜 " 要深得多。

一个逻辑合理的解释是,量化交易和 AI Agent 的底层逻辑是一样的:光有聪明的策略不赚钱,真正把策略变成钱的,是执行系统。光有强模型也不够,真正把模型变成生产力的,是上下文管理、工具调用、终端执行、测试反馈、权限控制、失败回滚。这些除模型本身以外的所有工作,都属于 Harness 的范畴,也就是 " 执行 "。

V4.1 解决的是 " 能不能写对代码 ",Harness 解决的是 " 写完后能不能跑通、报错后能不能自修、项目大了能不能协作 "。前者是模型能力,后者是工程能力。只有两者结合,DeepSeek 才有机会建立与 Claude Code 同级别的端到端工程智能。

这种挑战巨头的尝试,对工程师有很大的吸引力。目前,崔添翼在社交媒体上发布的招聘帖子,已经引来众多业界人士的投递。

03

Coding 之所以成为必争之地,是因为它是目前唯一可验证、可量化、可闭环的 AI 生产力。

判断一个 AI 能力达不达到生产力水平,有一个简单的标准:它的输出能不能在不依赖人类主观判断的情况下,被验证对错?

多模态模型生成一张图,好不好看?需要人看。通用对话模型回答一个问题,对不对?需要人判断。这些能力的验证成本极高,且标准不统一,企业很难量化 ROI。

但 Coding 的输出是一段程序,计算机可以直接执行并给出 pass/fail。写对了就运行,写错了就报错。这种自动可验证性使得 Coding 成为目前唯一一种 ROI 可以被精确计算的 AI 能力,企业能算出这个模型替代了多少工程师工时、产出了多少可运行代码、减少了多少 bug。

2026 年的 benchmark 竞争格局印证了这一点。SWE-bench Verified(让模型解决真实 GitHub issue 的测试)已经成为 "single most-cited coding benchmark" 和 "most load-bearing single benchmark for real-world developer workflows"。根据第三方 benchmark 聚合平台 llm-stats.com 的数据,当前前沿模型在这个测试上的竞争进入了白热化:Claude Opus 4.5 达到 80.9%,Opus 4.6 为 80.8%,Gemini 3.1 Pro 为 80.6%,GPT-5.2 为 80.0%,差距仅在 0.1 到 0.9 个百分点之间。

但在 SWE-bench Verified 这样的真实任务上,0.9% 的差距意味着:一个模型能独立解决某个复杂 issue 并上线运行,而另一个模型会在最后一步卡住。这不是差不多,而是能跑通和跑不通的区别。

而 6 月 12 日 Anthropic 被禁事件,进一步确认了 Coding 的基础设施地位。Anthropic 最强大的模型 Claude Fable 5 和 Mythos 5 被美国政府纳入出口管制,当天全球停服。这是美国首次将商业 AI 模型与先进半导体同等对待,纳入出口管制清单。Fable 5 的定价是 input $10/M、output $50/M,这不是软件工具的定价,而是基础设施的定价。

是的,AI coding 已经是 AI 时代的生产力基础设施,有没有是两个时代的分野:AI 生产力时代和前 AI 生产力时代。这反向验证了 DeepSeek 朝 AI coding 演进的意义:Coding 基础设施不能被垄断,必须平权化。

DeepSeek-V4-Flash 缓存命中输入价格仅为 0.2 元 / 百万 tokens,约为 Fable 5 的 1/138。但实际操作中,由于能力的欠缺,总的 token 成本并不一定比 Fable 5 低,更重要的是为生产力付费有马太效应:最好用的会收获绝大多数用户,形成正反馈飞轮,而能力稍显欠缺的,可能就成 Other。

但如果我们把 AI coding 看作是生产力基础设施,那么当 Coding 基础设施的边际成本不断降低,全球开发者也才能真正用上顶尖的 Coding 能力,释放巨大生产力。所以,以此为维度,DeepSeek 的低价路线,本质上是把 AI 生产力从奢侈品变成日用品。

据参与融资的投资人转述,梁文锋对所有投资人的最大要求是 " 不要挖 DeepSeek 的人 "。不是因为核心团队流失率高,事实上核心团队很稳定,离职者也不是做 Coding 的,而是当一个人坚信自己在做一件很重要的事情时,是不希望别人来挖角打扰的。

目前,Anthropic 的 Coding 领先是算法 + 算力 + 工程化 + 时间差的红利,马斯克认为最早到明年 Q1,中国 AI 团队就能造出 Mythos 5 量级的模型,但智谱的唐杰认为会更快。谁对谁错,由时间来证明。

让 AI 成为像水电一样的基础设施,像 TCP/IP、像 Linux、像电网,成为准公共品(Quasi-Public Good),会是 AI 生产力释放的关键。DeepSeek 拿着 500 亿,赌的就是 Coding 真正成为基础设施,人人可用。

DeepSeek 如果能在 coding 上建立 " 低成本 + 高性能 + 完整工具链 " 的优势,它实际上是在把 AI 从消费叙事切换到生产叙事。这不仅对 DeepSeek 自己重要,对中国整个 AI 产业都很关键。

十年前,我在融科资讯中心工作时,那群楼里还没有一家 AI 公司,现在,DeepSeek 的 Harness 团队正在那里面试产品经理。从乌兰察布的智算中心,到 V4.1 的蓄势待发,DeepSeek 正在推进它的计划。

遗憾的是,我没能力参与其中,只能记下这些观察。让时间去验证它的对错。

相关标签

相关阅读

最新评论

没有更多评论了