APP下载

关于ZAKER

Skills 合作

钛媒体 14分钟前

LongCat-2.0：美团咋卖上开源 AI 期房了？

文 | AI 唱反调

打开 Hugging Face 上 LongCat-2.0 的页面，标题下面是 logo 和 MIT License 标签，Model Introduction 里堆满了 1.6 万亿参数、480 亿激活、五万卡国产 ASIC 集群的硬数据。但滑到最底部，一个蓝色 Note 框里写着：Model weights coming soon — stay tuned!

浓密大眼的美团，还搞上预售制了，现房与期房说是。

不过讲真，美团这次确实干了一件硬事——五万卡国产专用 AI 加速芯片，区别于 NVIDIA 的通用 GPU，是面向大模型训练定制的专用计算芯片。不靠 NVIDIA 的 NCCL（NVIDIA 芯片之间的对讲机协议），采用国产集群自带的分布式通信协议做分布式训练，把 1.6T 参数的 MoE 模型从头训到尾。

1.6T 的总参数量，平均激活约 480 亿，原生支持 100 万 token 超长上下文。搭配稀疏注意力、多专家动态融合等一系列优化方案，据官方表述，这是国产算力生态中首次完成如此规模的端到端训练验证。

看下评分，SWE-bench Pro 拿到 59.5 分，略高于 GPT-5.5 的 58.6 分。国产算力生态喊了三年模芯协同，美团交出了第一份能跑通的 AI 期中作业。

但三个最能证明国产竞争力的数字，官方全部保密。芯片厂商是谁？训练总成本多少？wall-clock（实际训练耗时）多久？wall-clock 就是实际训练耗时，现在确实都看不到。

这三个数字藏着，全国产的真实成色、算力经济性、和 NVIDIA 的效率差距就都没法验证。行业也没法对标，没法复用。

有点像咱去买房，问能不能看看样板间咋装修的，人家说：样板间只能看照片。这个比喻不完全精准，毕竟模型都可以跑通了，但问题是，我还准备按照训练过程跑通全国产跑通美团，结果美团自己也没给机会。

权重即将推出，数据只字不提

美团说 LongCat 是 MIT 许可证开源，听起来敞亮。但点进 Hugging Face，权重状态写着 coming soon，即将推出，等于现在是个 " 待开源 " 状态。截至目前，官方只放出了推理框架和 Infra 代码；模型权重开不开、何时开、以什么协议开，全都待定。Infra 框架和推理引擎放出来了，但那 35T 以上 tokens 的训练数据，一个字没提。

开源权重不开源数据，等于美团只给了成品，不给配方。开发者能调用模型，但没法复现训练过程，这就相当于是 " 伪开源 " 了。行业内对大模型开源的默认共识，是至少开放权重、代码、训练数据配比与流程，保证第三方可以复现微调、甚至二次预训练。目前 LongCat 仅开放了推理侧框架，权重待上线、训练侧信息空白，更接近免费商用的闭源模型。

就比如咱拿 DeepSeek V4 比一下，权重、代码、训练数据配比全公开，社区可复现性更强。但 V4 并未像 LongCat 这样强调 " 五万卡国产算力从零训练 " 的工程验证。LongCat 反过来，训练全栈国产，但权重和数据捂着。一个赌全栈国产，一个赌全量开源，目前看谁都没走完。

美团捂着数据不难理解。LongCat 的训练数据里大概率混了大量业务数据，外卖订单、商家信息、用户评价、地理位置。这些是核心资产，不可能公开。但不公开数据构成与清洗规则，行业就无法验证测试集是否存在泄露风险，59.5 分的含金量，目前只能靠企业自己担保。

调用量全球前三：靠低价和免费额度

LongCat 在 OpenRouter 上以 Owl Alpha 的匿名身份跑了几个月，OpenRouter 是第三方模型调用平台，相当于模型的比价网站。

月调用量挤进全球前三。怎么来的？API 定价 0.30 美元每百万 token，远低于 GPT-5.5 的 2.50 美元，而且大量调用免费。

OpenRouter 的排行榜本身就是新模型冲知名度的常规赛道。行业通用玩法就是上线初期靠低价、免费额度冲榜，攒口碑再涨价。说白了，几乎没有哪个新模型的榜单成绩是纯靠付费用户打出来的。一旦收费，这个前三还能保持多久，才是真正的考题。

性能上，LongCat 对标的是 Claude Opus 4.6，但 Anthropic 已经迭代到 4.8，时间窗口就几个月。功能上，它是垂直模型，专为本地生活、Agentic Coding 优化，通用问答和多模态能力明显弱于同期竞品。

全网刷屏的通稿里，几乎都在刻意弱化本地生活垂直的定位，把 LongCat 包装成对标 GPT 的通用大模型突破。但本质上，它从训练目标到数据底座，都是为美团自家的商家智能助手、外卖调度、到店运营服务的。这个定位本身没问题，但放在国产算力突破的宏大叙事里，就容易被误读为通用大模型的胜利。

7 月国产模型正在扎堆发布。Kimi K3，2.5 万亿参数，通用多模态路线，对标 OpenAI 和 Anthropic。百度文心 5.0，2.4 万亿参数，原生全模态。DeepSeek V4，万亿级参数，开源加极低 API 成本，主打模型水电煤。美团 LongCat，1.6 万亿参数，本地生活垂直。参数一个比一个高，但路线彻底分化。资本市场逼着大家比参数，但企业真实需求是能把客服成本砍一半的轻量化方案。

你给一个奶茶店老板推 1.6 万亿参数的大模型，他只会问你能帮我自动回复差评吗。能，但用一个小模型也能做到，没必要上万亿参数。

按行业通用估算，五万卡集群三年折旧加电力加运维，总成本接近百亿级别。美团有外卖、到店、本地生活的现金流，可以摊平。纯 AI 创业公司没有这个缓冲池，根本学不了。阿里通义、京东言犀走通用模型微调加业务落地，轻、快、成本低。美团走全栈自研加从零训练，重、慢、壁垒高。两条路线没有对错，但中小厂根本学不了美团。

LongCat 的工程价值不可否认，但这条路很难复制。国产算力迈出了关键一步，这一步证明路能走，但能不能走得远，还得看钥匙什么时候交。

掌声可以先等一等

国产 AI 不缺突破、超车、第一的通稿。缺的是敢晒真实成本、敢公开核心供应链、敢让所有人复现的坦诚。

对行业而言，真正的交付至少包含三点：芯片与集群配置可核验、权重可下载、训练数据构成与清洗规则可追溯。在此之前，它更像一次工程演示，而非公共基础设施。

一家的里程碑，铺不成全行业的高速公路。楼盖得再高，钥匙不交、账单不晒、路径不说，就永远只是别人的楼。在权重可下、成本可核、数据可溯之前，这一次的掌声，不妨先缓一缓。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

LongCat-2.0：美团咋卖上开源 AI 期房了？

宙世代

一起剪

相关阅读

A股天价离婚！公司市值23亿元，分手费2.4亿元

雷神炽刃X7s Pro Max鼠标首发299元：PAW3955 Turbo传感器、双8K轮询率

AI抢占储能 芯片暴涨700%！机构预测千元手机明年或绝迹

估值180亿、对赌5年上市：快手可灵的背水一战

不止会尖叫 现在你的Steam手柄也可以自己去找充电器了

英伟达发明了“算力贷”

165天，拉美跨境的窟窿与钱

东芯股份：Q2利基存储产品涨价态势延续 预计下半年价格仍将上行

存储涨价终于要停了！三季度涨价幅度跌破20%

先进工艺产能爆发：EUV光刻机年销上百台 4亿美元超级EUV即将放量

磷化铟大厂AXT与Coherent签3年供应协议：预付超2200万美元

三星电子开启Q3价格谈判 力求通用DRAM环比涨价20%

注意了！国安部发文：阅后即焚软件不保险 可通过手机盗取你核心信息

99万的AI伴侣只卖给成年人，优必选先给自己出难题

EXPO ULL内存疯狂溢价79%！芝奇回应：是普通款还没涨

最新评论

钛媒体

热门推荐

企业资讯

AI抢占储能芯片暴涨700%！机构预测千元手机明年或绝迹

不止会尖叫现在你的Steam手柄也可以自己去找充电器了

东芯股份：Q2利基存储产品涨价态势延续预计下半年价格仍将上行

三星电子开启Q3价格谈判力求通用DRAM环比涨价20%

注意了！国安部发文：阅后即焚软件不保险可通过手机盗取你核心信息