关于ZAKER Skills 合作
钛媒体 26分钟前

MiniMax 发布新模型 M3,竞争转向长上下文与 Agent 能力

图片由 AI 生成

6 月 1 日,国产大模型公司 MiniMax 正式发布新一代通用模型 MiniMax M3。M3 采用新的自研稀疏注意力架构 MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个方向,实现代际突破。

MiniMax 表示,M3 是国内首个同时具备 " 前沿 Coding 能力、1M 超长上下文、原生多模态 " 三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。

相较传统全注意力机制,MSA 能够显著降低长上下文下的计算成本,并将上下文窗口提升至 100 万 token。这意味着,模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。

MiniMax 自研稀疏注意力架构 MiniMax Sparse Attention(MSA),图片来源:MiniMax

MiniMax 披露,在 100 万上下文规模下,M3 单 token 计算量仅为上一代模型的约 1/20,推理效率显著提升。

除模型架构升级外,MiniMax 在底层推理算子层面也进行了进一步优化。通过重新设计数据读取与计算路径,相关性能较主流开源方案提升 4 倍以上。

随着 Agent 任务复杂度不断提高,全球大模型竞赛面临新的变量," 更长上下文、更稳定记忆、更低成本推理 " 正在成为决定产品可用性的关键。

M3 在 Coding&Agentic 的能力上也做了提升。在衡量 Coding 能力的 SWE-Bench Pro 上,MiniMax M3 超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7。在综合评估 SVG 生成性能的基准 SVG-Bench 上,MiniMax M3 超过 Opus 4.7。

在多模态测试集 OmniDocBench 上,MiniMax M3 得分超过 Gemini 3.1 Pro,在面向自主 Agent 的端到端评测框架 Claw-Eval 上,MiniMax M3 得到最高分。

这主要是 M3 在编程与 Agent 训练中创新引入交互式用户模拟器框架——通过模拟真实开发者在协作过程中的行为模式,让模型在训练和评测阶段就接触到更接近生产环境的交互场景。

MiniMax 表示,M3 从训练起点便采用文本、图片、视频等多模态混合训练,并在数据规模和训练管线上进一步扩展。模型不仅支持图像与视频理解,也具备桌面操作能力,可在复杂跨应用环境中执行 Computer Use 任务。

无论是办公自动化、企业软件操作,还是更复杂的生产力场景,AI 进入实际执行层的速度正在明显加快。

同日,MiniMax Code 也迎来更新。这是一款专为 M3 设计,并与 M3 一起训练的 Agent 产品。在长程复杂任务上,MiniMax Code 的 Agent Team 可以将大型任务拆解为多阶段、可并发、可动态调整的 Workflow,由 Agent 集群协作推进。

M3 的出现是对闭源力量的一次挑战。事实上,闭源模型(如 OpenAI、Google、Anthropic 的旗舰模型)垄断着全球最顶尖的逻辑推理、复杂编程和多模态代理能力。MiniMax M3 用 " 开源 + 全能 " 的差异化的定位,核心是在抢占那些对数据隐私极其敏感,同时又对智能体性能要求极高的企业级核心客群。

在商业化方面,MiniMax 同步推出 Token Plan 订阅方案也颇具价格优势,将使用成本拉入了 " 百元时代 ",试图通过极致性价比抢占全球开发者生态。目前,Plus 版每月 49 元,提供 6 亿 token;Max 版每月 119 元,提供 18 亿 token;Ultra 版每月 469 元,提供 55 亿 token。(本文首发于钛媒体 APP,作者|李程程,编辑|杨林)

相关标签
ai

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容