月之暗面黄震昕：Kimi 不做重交付，FDE 难点不在于模型厂商

今年以来，当头部的大模型厂商在围绕模型迭代、产品力、融资、上市等集体抢占时间窗口时，商业化这个命题也被悄然塞进了他们的时间表里。

结合近期 Kimi 对外的披露，以及与月之暗面 Kimi B 端负责人黄震昕的交流，可以梳理出这家公司在商业化路径上的一系列战略选择与自我定位。

在过去两年间，Kimi 首次大规模应用二阶优化器 Muon 取代了已成为行业标准 10 年之久的 Adam 优化器，推出基于 KDA 注意力机制的 Kimi Linear 架构，以及推出注意力残差方案，对计算效率得以大幅提升。

关于 Harness，Kimi 的判断是：随着基础模型变强，对外部复杂 Harness 的要求会降低，类似去年 Prompt 工程热度的下降。因此 Kimi 内部已开始实践 Loop Engineering（循环工程）。

黄震昕认为，随着 Token 市场价格走高，用户对于高性能的 Token 需求仍有支付意愿，同时，虽然由于芯片荒和算力成本上升导致成本在涨，但模型厂商也在通过技术优化，将 Token 的实际成本往下降低。

在定价策略上，Kimi 的定位是做高性能模型，而非最便宜的模型。尤其是伴随今年模型价格的集体上涨，背后核心原因仍然是全球算力供应跟不上 Token 需求增长。为此，Kimi 对冲成本压力的方式是通过技术优化，其 KV-Cache 命中率达到 90% 以上。

" 评估模型价格不能只看输入输出定价，还要看 KV-Cache 命中率。只要命中，成本就会降很多，能给用户节省成本。" 黄震昕告诉笔者。

作为 Kimi B 端负责人，黄震昕还着重提及了 Kimi 在 To B 业务的布局，包括三层服务体系：模型层提供 K2.7 Code、K2.6 等基础模型；架构层提供 API 及 Agent SDK；产品层推出企业版，包含 Kimi Agent 集群、Kimi Code、Kimi Work 等工具。黄震昕指出，Kimi 不会做太重的交付工作，" 模型本身还有大量技术难题待攻克，Kimi 能把模型做好已经非常不易。"

对于企业级应用所需的 " 最后一公里 " 服务，Kimi 选择通过 FDE 合作伙伴来完成端到端交付，而非自建重服务团队。在行业解决方案层面，Kimi 也在尝试与亚马逊云科技等合作构建金融、医疗、制造等垂直场景的方案，前者提供模型能力，而后者主要提供行业经验与客户资源。

以下是黄震昕在亚马逊云科技中国峰会上的演讲全文。

我是月之暗面（Moonshot AI）的黄震昕，负责公司的 B 端业务。很高兴能在亚马逊云科技中国峰会上和大家分享我们的思考。

我加入月之暗面时，就被一个愿景所吸引：致力于寻找将能源转化为智能的最优解。为什么选择这个命题？人类历史上有三次真正的能源变迁。第一次是我们学会了利用阳光，第二次是我们发掘了煤炭，第三次，也就是现在，我们正在学习如何将能源高效地转化为智能。前两次转化是线性的、有限的，而这一次转化是可逆的、可扩展的、可存储的。

关于实现这一最优解，我们的目标一直是做出全球领先的模型。因此，对于月之暗面来说，扩大模型规模（Scaling）是一个必选项。大家从新闻中也了解到，我们近期完成了规模不小的融资，但和海外同行相比，这笔资金并不算多。因此，我们致力于找到效率的最优解。

为此，我们选择了三个技术方向，因为它们对应了智能体的三个核心能力维度：聪明程度、干活时长（Long Context）和协作能力（Agent Swarm）。

第一，聪明程度。数据并非无限，在相同的算力下，谁能学得更聪明，谁就更具优势。

第二，干活时长。这决定了模型如何能处理更长时间的任务，同时不忘记最初的目标是什么。

第三，协作能力。单个智能体再强大，也有其局限性。如何让多个智能体有效组队，协作完成复杂的用户任务，是另一个关键。

这三个维度结合起来，就是 AI 产品能力的整体体现。自 2025 年以来，我们在这三个方向上都取得了关键突破。大家可以看到，Kimi 的每一项创新，都瞄准了最基础的模型架构，而不仅仅是工程效率的优化。

以优化器为例，经典的 Adam 优化器诞生于 11 年前，我们将一种新的优化技术运用到了大部分训练中，使实际数据的使用效率提升了 27%，整体效率直接翻倍。在长文本（Long Context）方面，传统的 Attention 架构诞生于八年前，我们推出了 Kimi Linear Attention 技术，将在下一代模型中应用。传统架构下，模型扩大十倍，训练和推理成本将扩大一百倍；而采用新技术后，仅需十倍的算力即可实现。此外，残差连接技术诞生于十年前，我们推出了注意力残差（Attention Residual）技术，使效率提升了 25%。

马斯克也曾专门为我们的技术点赞。可以说，模型的规模瓶颈正在被我们逐一解决，更大规模、更高质量的模型成为可能。一个行业常识是，KV 缓存命中率很大程度上影响用户的最终使用成本。我们通过研发 Kimi 的工程优化，持续提升效率，降低 KV 缓存失效率，从而降低了 API 的使用成本，让更多用户能够用得起。

最近，我们也发布了 Kimi K2.7，其代码能力大幅提升。我们还特别推出了高速版本，输出速度达到了 180 token/ 秒。很多朋友反馈，用上之后就再也回不去了。这也是我们努力通过推理优化提升客户体验的例证。

Kimi 是一家注重审美的公司，我们的品牌调性很明确，专注于生产力领域。我们把有限的能源和算力，集中在学术研究、软件工程、复杂推理等领域。长期使用的用户会发现，我们的核心场景始终围绕着提升生产力。

大家可能对 Kimi 的印象更多停留在 To C 端，但其实我们在 To B 领域也并非简单地售卖 API，而是提供了一整套完整的生产力赋能体系。该体系具备三层能力：

模型层：Kimi 持续做最强的基础模型。目前底座已涵盖 K2.7 Code、K2.6 和 K2.5 等模型，为企业级应用提供坚实的智能底座。

服务层：Kimi 提供丰富的 API，开发者可以借此进行深度集成，将 Kimi 的能力无缝嵌入到企业自身的工作流中，例如网页搜索、PPT 生成等。

工具 / 产品层：Kimi 提供包括 Kimi Agent 集群、Kimi Code、Kimi Claw、Kimi Work 等开箱即用的产品。该层级直接解决企业真实场景中的复杂问题，例如让 Agent 自动处理报表、生成行业分析、管理项目文档等。

在全球化业务拓展方面，Kimi 正携手亚马逊云科技推进全球业务协同，借助其从基础设施层到应用落地层面的全方位助力，实现全球化规模加速，为全球企业赋能生产力：

基础设施和服务层面：Kimi 运行在亚马逊云科技遍布全球的数据中心和网络基础设施上，获得了稳定可靠的算力支持，确保模型运行得又快又稳。Kimi 多个模型现已登陆 Amazon SageMaker，让更多开发者可以进行模型的训练与推理，大幅降低使用门槛。同时，Amazon Bedrock 已经接入了 Kimi K2.5 等开源模型，未来 Kimi 正在积极推进接入更多最新模型，让用户无需自行管理基础设施或单独部署服务器就能使用 Kimi 模型。此外，Amazon Bedrock Guardrails 的企业级安全能力也将自动适用于 Kimi，提供有害内容过滤、提示词攻击防护以及企业合规保障。

业务合作层面：Kimi 已登陆亚马逊云科技 Marketplace，直接触达全球数百万活跃企业客户。全球客户可以通过该数字软件市场简化采购流程，实现一键使用、按量付费与零门槛接入。同时，借助 APN 合作伙伴网络，Kimi 正在快速拓展企业客户。

垂直行业层面：Kimi 与亚马逊云科技联合打造行业解决方案，已覆盖金融、医疗、制造等垂直行业场景。在合作中，Kimi 提供核心大模型，亚马逊云科技发挥其丰富的行业经验与客户资源，共同将 Kimi 的能力无缝嵌入到企业的真实业务流程中。

以上就是今天的分享。我们期待与亚马逊云科技携手，继续探索将能源转化为智能的最优解。

（作者 | 杨丽，编辑 | 杨林）

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

月之暗面黄震昕：Kimi 不做重交付，FDE 难点不在于模型厂商

宙世代

一起剪

相关阅读

普通用户5TB封顶！豆包上线付费云存储扩容服务

优艾智合具身智能系列新品全球首发，3年赋能10000个工业现场

读懂物理AI：AI产业的下半场，不止是概念狂欢

“耀速科技”完成近2亿元A+轮融资

巴黎麦当劳后厨逼近50度：火速下订100台空调

英国竞争监管机构拟加强监管苹果、谷歌移动平台：放宽应用“引流”限制 并推进NFC开放

产教融合升级，这所民办高校组了个“AI天团”

三星、SK海力士、美光一起被告！操控内存价格、制造缺货恐慌

玻璃基板概念再续狂飙，京东方A一度涨停创18年新高

撬动内存墙的铁锹有哪些？

豆包回应“内测社交功能”传闻；美的回应空调产品在欧洲被疯抢

一代人的青春！停更5年突然发文：西祠胡同官宣明日回归

美媒怒批苹果、微软：别甩锅美光！真正根源是自家AI烧钱太狠

iPhone也能有背屏了！OPPO Bubble潮玩自拍屏官宣适配：499元

最新评论

钛媒体

热门推荐

企业资讯

英国竞争监管机构拟加强监管苹果、谷歌移动平台：放宽应用“引流”限制并推进NFC开放