关于ZAKER Skills 合作
钛媒体 14分钟前

LongCat-2.0:美团咋卖上开源 AI 期房了?

文 | AI 唱反调

打开 Hugging Face 上 LongCat-2.0 的页面,标题下面是 logo 和 MIT License 标签,Model Introduction 里堆满了 1.6 万亿参数、480 亿激活、五万卡国产 ASIC 集群的硬数据。但滑到最底部,一个蓝色 Note 框里写着:Model weights coming soon — stay tuned!

浓密大眼的美团,还搞上预售制了,现房与期房说是

不过讲真,美团这次确实干了一件硬事——五万卡国产专用 AI 加速芯片,区别于 NVIDIA 的通用 GPU,是面向大模型训练定制的专用计算芯片。不靠 NVIDIA 的 NCCL(NVIDIA 芯片之间的对讲机协议),采用国产集群自带的分布式通信协议做分布式训练,把 1.6T 参数的 MoE 模型从头训到尾。

1.6T 的总参数量,平均激活约 480 亿,原生支持 100 万 token 超长上下文。搭配稀疏注意力、多专家动态融合等一系列优化方案,据官方表述,这是国产算力生态中首次完成如此规模的端到端训练验证。

看下评分,SWE-bench Pro 拿到 59.5 分,略高于 GPT-5.5 的 58.6 分。国产算力生态喊了三年模芯协同,美团交出了第一份能跑通的 AI 期中作业。

但三个最能证明国产竞争力的数字,官方全部保密。芯片厂商是谁?训练总成本多少?wall-clock(实际训练耗时)多久?wall-clock 就是实际训练耗时,现在确实都看不到。

这三个数字藏着,全国产的真实成色、算力经济性、和 NVIDIA 的效率差距就都没法验证。行业也没法对标,没法复用。

有点像咱去买房,问能不能看看样板间咋装修的,人家说:样板间只能看照片。这个比喻不完全精准,毕竟模型都可以跑通了,但问题是,我还准备按照训练过程跑通全国产跑通美团,结果美团自己也没给机会。

权重即将推出,数据只字不提

美团说 LongCat 是 MIT 许可证开源,听起来敞亮。但点进 Hugging Face,权重状态写着 coming soon,即将推出,等于现在是个 " 待开源 " 状态。截至目前,官方只放出了推理框架和 Infra 代码;模型权重开不开、何时开、以什么协议开,全都待定。Infra 框架和推理引擎放出来了,但那 35T 以上 tokens 的训练数据,一个字没提。

开源权重不开源数据,等于美团只给了成品,不给配方。开发者能调用模型,但没法复现训练过程,这就相当于是 " 伪开源 " 了。行业内对大模型开源的默认共识,是至少开放权重、代码、训练数据配比与流程,保证第三方可以复现微调、甚至二次预训练。目前 LongCat 仅开放了推理侧框架,权重待上线、训练侧信息空白,更接近免费商用的闭源模型。

就比如咱拿 DeepSeek V4 比一下,权重、代码、训练数据配比全公开,社区可复现性更强。但 V4 并未像 LongCat 这样强调 " 五万卡国产算力从零训练 " 的工程验证。LongCat 反过来,训练全栈国产,但权重和数据捂着。一个赌全栈国产,一个赌全量开源,目前看谁都没走完

美团捂着数据不难理解。LongCat 的训练数据里大概率混了大量业务数据,外卖订单、商家信息、用户评价、地理位置。这些是核心资产,不可能公开。但不公开数据构成与清洗规则,行业就无法验证测试集是否存在泄露风险,59.5 分的含金量,目前只能靠企业自己担保。

调用量全球前三:靠低价和免费额度

LongCat 在 OpenRouter 上以 Owl Alpha 的匿名身份跑了几个月,OpenRouter 是第三方模型调用平台,相当于模型的比价网站。

月调用量挤进全球前三。怎么来的?API 定价 0.30 美元每百万 token,远低于 GPT-5.5 的 2.50 美元,而且大量调用免费。

OpenRouter 的排行榜本身就是新模型冲知名度的常规赛道。行业通用玩法就是上线初期靠低价、免费额度冲榜,攒口碑再涨价。说白了,几乎没有哪个新模型的榜单成绩是纯靠付费用户打出来的。一旦收费,这个前三还能保持多久,才是真正的考题

性能上,LongCat 对标的是 Claude Opus 4.6,但 Anthropic 已经迭代到 4.8,时间窗口就几个月。功能上,它是垂直模型,专为本地生活、Agentic Coding 优化,通用问答和多模态能力明显弱于同期竞品。

全网刷屏的通稿里,几乎都在刻意弱化本地生活垂直的定位,把 LongCat 包装成对标 GPT 的通用大模型突破。但本质上,它从训练目标到数据底座,都是为美团自家的商家智能助手、外卖调度、到店运营服务的。这个定位本身没问题,但放在国产算力突破的宏大叙事里,就容易被误读为通用大模型的胜利。

7 月国产模型正在扎堆发布。Kimi K3,2.5 万亿参数,通用多模态路线,对标 OpenAI 和 Anthropic。百度文心 5.0,2.4 万亿参数,原生全模态。DeepSeek V4,万亿级参数,开源加极低 API 成本,主打模型水电煤。美团 LongCat,1.6 万亿参数,本地生活垂直。参数一个比一个高,但路线彻底分化。资本市场逼着大家比参数,但企业真实需求是能把客服成本砍一半的轻量化方案。

你给一个奶茶店老板推 1.6 万亿参数的大模型,他只会问你能帮我自动回复差评吗。能,但用一个小模型也能做到,没必要上万亿参数。

按行业通用估算,五万卡集群三年折旧加电力加运维,总成本接近百亿级别。美团有外卖、到店、本地生活的现金流,可以摊平。纯 AI 创业公司没有这个缓冲池,根本学不了。阿里通义、京东言犀走通用模型微调加业务落地,轻、快、成本低。美团走全栈自研加从零训练,重、慢、壁垒高。两条路线没有对错,但中小厂根本学不了美团。

LongCat 的工程价值不可否认,但这条路很难复制。国产算力迈出了关键一步,这一步证明路能走,但能不能走得远,还得看钥匙什么时候交。

掌声可以先等一等

国产 AI 不缺突破、超车、第一的通稿。缺的是敢晒真实成本、敢公开核心供应链、敢让所有人复现的坦诚。

对行业而言,真正的交付至少包含三点:芯片与集群配置可核验、权重可下载、训练数据构成与清洗规则可追溯。在此之前,它更像一次工程演示,而非公共基础设施。

一家的里程碑,铺不成全行业的高速公路。楼盖得再高,钥匙不交、账单不晒、路径不说,就永远只是别人的楼。在权重可下、成本可核、数据可溯之前,这一次的掌声,不妨先缓一缓。

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容