
最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 将永久降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度更快,服务更稳定,默认支持 500 并发,企业用户可以在线申请更高并发。
发布模型,再给出折扣,接着降低缓存命中价格,最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下一站,很可能是 Agent。

让我们先来简单梳理一下 DeepSeek 的降价时间线:
4 月 24 日,DeepSeek V4 预览版正式发布。
4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
4 月 26 日,DeepSeek 宣布缓存命中价格调整为首发价的十分之一。
4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
5 月 22 日,DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。
时间线的关键之处,在于临时折扣变成了永久降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;
输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官方 API 对开发者和企业的吸引力进一步提高。

而价格下调最直接的影响,是把任务成本推到开发者决策的更前端。
在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。
长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。
过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价,也意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。

智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。
但如果 DeepSeek 后续推出类似 Claude Code 的编码工具,再用低 token 成本支撑高频调用,价格敏感的开发者群体会更容易被吸引过来。
梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。
早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。
比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。

他认为,DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、视频这些产品线,而是通过持续降低训练和推理的资源需求,推动一套更便宜、更分散的 AI 硬件生态成形。
在他看来,DeepSeek 的长期价值不只在模型本身,而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和推理工程优化,往深处看,都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。
一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。
在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。

他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估算 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。

一个 Code Agent 处理项目时,可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。
DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果,也将彻底搅动 AI 编程市场格局。
为什么必须做中国版「Claude Code」?
最先被牵动的,是 AI 编程工具的订阅模式。
市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗极低。
但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。
当底层 API 又同时大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?
同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移更重要。
沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后更值得追问的,是开发者入口究竟掌握在谁手里。

他还提到,更关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是一个需要接触 data flows(数据流)的领域。
终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交,判断一次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。
从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。
我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是,DeepSeek 资深研究员陈德里直接发出招聘信息,提到要从零开始构建 Code Harness。

DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。
崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属性有关。
公开信息显示,崔添翼本科毕业于浙江大学计算机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金牌,之后在 Jane Street 工作 9 年,并联合创立 TSY Capital。

而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。
这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有更强的替代价值。
DeepSeek 做中国版 Claude Code 的逻辑也正在于此:低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。
就像滚下坡的雪球,越滚越大,滚得越快。降价只是推下山的第一把力,往后它会自己越滚越沉,谁也拦不住。
觉得文章不错,微信扫描分享好友
热门推荐
企业资讯
- 不满奖金悬殊过大 三星非芯片部门员工寻求法院阻止初步协议的表决 新浪财经
- 胡之华钢琴独奏作品新专辑《琴声如歌》在纽约林肯广场录制 乐推娱乐爆料
- 吉林化纤股价跌3.18% 新浪财经
- 京东发布2026年Q1财报,活跃用户保持双位数增长,研发投入同比增长59%_发现频道_中国青年网 每日新闻摘录
- 华为哈勃近期入股弥尔光半导体公司,华为哈勃今年已入股多家公司 慧姐读财
- 民生银行太原分行“踩雷”:留神峪矿难实控人质押融资2.79亿 独角金融
- 科创新源:股东科创鑫华质押253万股 每日经济新闻
- 金溢科技:股东王丽娟计划减持公司股份不超过约78万股 每日经济新闻
- 新三板创新层公司赢家伟业登龙虎榜:当日价格振幅达到87.00% 每日经济新闻
- 麦捷科技:公司与多个国内外头部算力、存力厂商保持有良好的合作关系,目前正积极规划并推进扩产计划 每日经济新闻
- 收购消息引爆股价!优步据悉将提高报价竞购德国Delivery Hero 财联社-深度
- 新三板创新层公司飞驰环保大宗交易溢价25%,成交金额142.77万元 每日经济新闻
- 特朗普手机图赏:质感俗气 被吐槽像尿液黄 快科技
- 华为韬定律从手机SoC杀入AI :昇腾990首次引入!集成度增长超100倍 快科技
- 全市场唯一使用动量因子选股ETF,创业板成长ETF华夏(159967)冲击前高 每日经济新闻
- 航空航天板块小幅上涨,卫星ETF易方达(563530)获资金加仓 每日经济新闻
- 消息称苹果iPhone 17标准版扩产 下半年或开启降价 手机中国
- 中东通(Gulf Connect)——为中国企业出海中东,搭好“隐形桥梁” 新浪财经
- 中国首次!华为发表半导体韬定律,芯片半导体持续走强 每日经济新闻
- 汽车感知质量开发与评价培训会在京举办 车质网