关于ZAKER Skills 合作
钛媒体 26分钟前

月之暗面黄震昕:Kimi 不做重交付,FDE 难点不在于模型厂商

今年以来,当头部的大模型厂商在围绕模型迭代、产品力、融资、上市等集体抢占时间窗口时,商业化这个命题也被悄然塞进了他们的时间表里。

结合近期 Kimi 对外的披露,以及与月之暗面 Kimi B 端负责人黄震昕的交流,可以梳理出这家公司在商业化路径上的一系列战略选择与自我定位。

在过去两年间,Kimi 首次大规模应用二阶优化器 Muon 取代了已成为行业标准 10 年之久的 Adam 优化器,推出基于 KDA 注意力机制的 Kimi Linear 架构,以及推出注意力残差方案,对计算效率得以大幅提升。

关于 Harness,Kimi 的判断是:随着基础模型变强,对外部复杂 Harness 的要求会降低,类似去年 Prompt 工程热度的下降。因此 Kimi 内部已开始实践 Loop Engineering(循环工程)。

黄震昕认为,随着 Token 市场价格走高,用户对于高性能的 Token 需求仍有支付意愿,同时,虽然由于芯片荒和算力成本上升导致成本在涨,但模型厂商也在通过技术优化,将 Token 的实际成本往下降低。

在定价策略上,Kimi 的定位是做高性能模型,而非最便宜的模型。尤其是伴随今年模型价格的集体上涨,背后核心原因仍然是全球算力供应跟不上 Token 需求增长。为此,Kimi 对冲成本压力的方式是通过技术优化,其 KV-Cache 命中率达到 90% 以上。

" 评估模型价格不能只看输入输出定价,还要看 KV-Cache 命中率。只要命中,成本就会降很多,能给用户节省成本。" 黄震昕告诉笔者。

作为 Kimi B 端负责人,黄震昕还着重提及了 Kimi 在 To B 业务的布局,包括三层服务体系:模型层提供 K2.7 Code、K2.6 等基础模型;架构层提供 API 及 Agent SDK;产品层推出企业版,包含 Kimi Agent 集群、Kimi Code、Kimi Work 等工具。黄震昕指出,Kimi 不会做太重的交付工作," 模型本身还有大量技术难题待攻克,Kimi 能把模型做好已经非常不易。"

对于企业级应用所需的 " 最后一公里 " 服务,Kimi 选择通过 FDE 合作伙伴来完成端到端交付,而非自建重服务团队。在行业解决方案层面,Kimi 也在尝试与亚马逊云科技等合作构建金融、医疗、制造等垂直场景的方案,前者提供模型能力,而后者主要提供行业经验与客户资源。

以下是黄震昕在亚马逊云科技中国峰会上的演讲全文。

我是月之暗面(Moonshot AI)的黄震昕,负责公司的 B 端业务。很高兴能在亚马逊云科技中国峰会上和大家分享我们的思考。

我加入月之暗面时,就被一个愿景所吸引:致力于寻找将能源转化为智能的最优解。为什么选择这个命题?人类历史上有三次真正的能源变迁。第一次是我们学会了利用阳光,第二次是我们发掘了煤炭,第三次,也就是现在,我们正在学习如何将能源高效地转化为智能。前两次转化是线性的、有限的,而这一次转化是可逆的、可扩展的、可存储的。

关于实现这一最优解,我们的目标一直是做出全球领先的模型。因此,对于月之暗面来说,扩大模型规模(Scaling)是一个必选项。大家从新闻中也了解到,我们近期完成了规模不小的融资,但和海外同行相比,这笔资金并不算多。因此,我们致力于找到效率的最优解。

为此,我们选择了三个技术方向,因为它们对应了智能体的三个核心能力维度:聪明程度、干活时长(Long Context)和协作能力(Agent Swarm)。

第一,聪明程度。数据并非无限,在相同的算力下,谁能学得更聪明,谁就更具优势。

第二,干活时长。这决定了模型如何能处理更长时间的任务,同时不忘记最初的目标是什么。

第三,协作能力。单个智能体再强大,也有其局限性。如何让多个智能体有效组队,协作完成复杂的用户任务,是另一个关键。

这三个维度结合起来,就是 AI 产品能力的整体体现。自 2025 年以来,我们在这三个方向上都取得了关键突破。大家可以看到,Kimi 的每一项创新,都瞄准了最基础的模型架构,而不仅仅是工程效率的优化。

以优化器为例,经典的 Adam 优化器诞生于 11 年前,我们将一种新的优化技术运用到了大部分训练中,使实际数据的使用效率提升了 27%,整体效率直接翻倍。在长文本(Long Context)方面,传统的 Attention 架构诞生于八年前,我们推出了 Kimi Linear Attention 技术,将在下一代模型中应用。传统架构下,模型扩大十倍,训练和推理成本将扩大一百倍;而采用新技术后,仅需十倍的算力即可实现。此外,残差连接技术诞生于十年前,我们推出了注意力残差(Attention Residual)技术,使效率提升了 25%。

马斯克也曾专门为我们的技术点赞。可以说,模型的规模瓶颈正在被我们逐一解决,更大规模、更高质量的模型成为可能。一个行业常识是,KV 缓存命中率很大程度上影响用户的最终使用成本。我们通过研发 Kimi 的工程优化,持续提升效率,降低 KV 缓存失效率,从而降低了 API 的使用成本,让更多用户能够用得起。

最近,我们也发布了 Kimi K2.7,其代码能力大幅提升。我们还特别推出了高速版本,输出速度达到了 180 token/ 秒。很多朋友反馈,用上之后就再也回不去了。这也是我们努力通过推理优化提升客户体验的例证。

Kimi 是一家注重审美的公司,我们的品牌调性很明确,专注于生产力领域。我们把有限的能源和算力,集中在学术研究、软件工程、复杂推理等领域。长期使用的用户会发现,我们的核心场景始终围绕着提升生产力。

大家可能对 Kimi 的印象更多停留在 To C 端,但其实我们在 To B 领域也并非简单地售卖 API,而是提供了一整套完整的生产力赋能体系。该体系具备三层能力:

模型层:Kimi 持续做最强的基础模型。目前底座已涵盖 K2.7 Code、K2.6 和 K2.5 等模型,为企业级应用提供坚实的智能底座。

服务层:Kimi 提供丰富的 API,开发者可以借此进行深度集成,将 Kimi 的能力无缝嵌入到企业自身的工作流中,例如网页搜索、PPT 生成等。

工具 / 产品层:Kimi 提供包括 Kimi Agent 集群、Kimi Code、Kimi Claw、Kimi Work 等开箱即用的产品。该层级直接解决企业真实场景中的复杂问题,例如让 Agent 自动处理报表、生成行业分析、管理项目文档等。

在全球化业务拓展方面,Kimi 正携手亚马逊云科技推进全球业务协同,借助其从基础设施层到应用落地层面的全方位助力,实现全球化规模加速,为全球企业赋能生产力:

基础设施和服务层面:Kimi 运行在亚马逊云科技遍布全球的数据中心和网络基础设施上,获得了稳定可靠的算力支持,确保模型运行得又快又稳。Kimi 多个模型现已登陆 Amazon SageMaker,让更多开发者可以进行模型的训练与推理,大幅降低使用门槛。同时,Amazon Bedrock 已经接入了 Kimi K2.5 等开源模型,未来 Kimi 正在积极推进接入更多最新模型,让用户无需自行管理基础设施或单独部署服务器就能使用 Kimi 模型。此外,Amazon Bedrock Guardrails 的企业级安全能力也将自动适用于 Kimi,提供有害内容过滤、提示词攻击防护以及企业合规保障。

业务合作层面:Kimi 已登陆亚马逊云科技 Marketplace,直接触达全球数百万活跃企业客户。全球客户可以通过该数字软件市场简化采购流程,实现一键使用、按量付费与零门槛接入。同时,借助 APN 合作伙伴网络,Kimi 正在快速拓展企业客户。

垂直行业层面:Kimi 与亚马逊云科技联合打造行业解决方案,已覆盖金融、医疗、制造等垂直行业场景。在合作中,Kimi 提供核心大模型,亚马逊云科技发挥其丰富的行业经验与客户资源,共同将 Kimi 的能力无缝嵌入到企业的真实业务流程中。

以上就是今天的分享。我们期待与亚马逊云科技携手,继续探索将能源转化为智能的最优解。

(作者 | 杨丽,编辑 | 杨林)

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容