关于ZAKER Skills 合作
钛媒体 20分钟前

为什么阶跃星辰获得了第二次机会

文 | 智见 time,作者 | 李浩 ,编辑 | 经纬

一日不见,如隔三秋。这句话在 AI 领域也非常适用。

随着技术的成熟、用户的接受、资本的站队,AI 大厂之间的比拼从排位赛转向淘汰赛。

模型性能、用户流量、品牌知名度、资本声量、落地进度……所有维度都在以月,甚至以星期为单位快速迭代。一家企业今天还站在聚光灯下,几个月后就可能被迅速甩开,甚至悄然掉队。AI 排名网站 LLM Arena 上常常会出现几家大厂谁更新了一个版本,谁就能成为国内大模型性能第一的情况。

在这样的战场上,争分夺秒成为常态。一次战略误判、一次融资的延误、一次技术掉队、甚至一次核心团队人员变动,往往就意味着从领先集团滑落到第二梯队,甚至可能被彻底淘汰出局。

在 2024 年的百模大战中,阶跃星辰并没有持续的亮眼表现。它推出过 " 跃问 " 助手和 " 冒泡鸭 " 角色扮演产品,但并未在 C 端掀起波澜。很多人把它归为 " 六小龙 " 中相对低调的一员,甚至一度认为它会成为又一个默默掉队的玩家。

但是 5 月 29 日,阶跃星辰发布并开源了 Step 3.7 Flash。该模型总参数接近 200B,激活参数却只有约 11B,最高生成速度达到 400 Tokens/s。在 Artificial Analysis 的综合评测中,它拿下了输出速度、端到端响应、性价比等多项第一。

从早期探索失利,到战略聚焦,再到资本补票,阶跃星辰用 18 个月时间完成了从 " 多模态卷王 " 到 " 高效 Real-World Agent 玩家 " 的跃迁。

跌倒与跌倒之后

虽然当前阶段,动辄以百亿为投资单位的 AI 行业,有资格 " 刷脸 " 的玩家都不会太缺 " 余粮 "。但是业内,仍不乏诸多新秀销声匿迹的故事。

比如 DeepMind 联合创始人 Mustafa Suleyman 创立的 Inflection AI。Inflection AI 曾以 Pi 聊天机器人和高调融资,成为 OpenAI 最直接竞争者之一。但 2024 年后即使曾经顶着 Mustafa 的大神光环,Inflection AI 也未能走出自己的道路。最终核心团队转投 Microsoft,公司也从明日之星变为查无此人。

聊天机器人,有 ChatGPT、Gemini、Claude 等大佬压制,有已经被同行炒上天的获客成本,小厂却难以形成足够强的技术壁垒。C 端机器人的 " 阵亡率 " 一度冠绝其他 AI 赛道。Character.AI、Jasper、Copy.ai、Tome 等国外一度爆火的产品,曾经的资本宠儿,或卖身大厂,或黯然离场。

国内也有被聊天机器人 " 坑的 "。

2024 年 3 月,成立不到一年的阶跃星辰首次公开亮相,便以高调姿态切入 C 端市场。当时公司同时推出了两款面向消费者的产品,智能对话助手 " 跃问 ",和角色扮演智能体 " 冒泡鸭 "。其中,跃问被定位为个人效率工具,支持图片上传、文档解析和联网搜索,核心卖点正是阶跃星辰当时引以为傲的多模态能力。

阶跃星辰的思路确实没什么问题。那一年,多模态的确是很能打的差异化标签。

2024 年上半年,国内大部分大模型仍以纯语言能力为主,多模态普遍处于早期阶段。智谱 AI 的 GLM-4V、阿里 Qwen-VL 系列虽已推出,但视觉理解深度和复杂场景仍需要改进。月之暗面 Kimi 和 MiniMax 当时的多模态能力相对薄弱,主要依赖后期拼接而非原生训练。

与其他玩家的对比来看,阶跃的 Step-1V 在图像理解、多轮视觉指令跟随、图表 / 文档解析等细分评测中,曾多次位居国内前列,尤其在 OpenCompass 等中文多模态榜单上表现出色,一度被认为是国内多模态理解能力最强的模型之一。

但是技术上的领先并没有转变为商业上的优势。

跃问和冒泡鸭推出后,用户反馈整体平淡。整体来看,阶跃的两款产品虽然具备图片理解等功能,但当时多模态能力还不够成熟,在复杂场景下的表现不够惊艳,用户留存和活跃度因此未能达到预期。冒泡鸭在角色扮演赛道直接面对 MiniMax " 星野 " 等竞品,后者日活跃用户一度维持在约 50 万规模,而冒泡鸭的表现明显落后。

小红书上,曾有自称跃问开发者的博主发帖,向网友征求对产品的问题或意见。但得到的回复大多是吐槽某面试官和其他不相关内容,帖子热度也不高。唯一与跃问的使用体验相关的问题是图文混排问题,博主的回答是公司正在优化该问题,但随后也没有了下文。

但是时间不等人。2024 年下半年,豆包已经杀出,DeepSeek 也即将在半年后震撼整个行业。

这样的环境里,在大厂可以依靠此前建设的用户生态和重金投流的 C 端战场,小厂的生存法则则是打出技术优势并快速转化为极致的产品体验。

但是对于彼时的阶跃星辰而言,这两者都不具备。

补票?预判?

对于产品的遇冷,阶跃星辰还挣扎了一番。

直到 2024 年底,阶跃停止了对 " 冒泡鸭 " 的大规模投流,并着手将团队合并。

2025 年,公司正式对 C 端业务进行收敛,将 " 跃问 " 更名为 " 阶跃 AI",并将产品战略从类 ChatGPT 的对话产品转向任务型智能体。

对此,阶跃星辰在接受媒体采访时曾公开回应称:" 早期,我们基于当时的模型能力进行了一些产品探索。2025 年,随着多模态和推理能力的成熟,我们产品进行收敛,聚焦 Agent 方向。"

Agent 与多模态有着天然高契合度。

Agent 的核心在于理解环境、规划任务和执行动作。而要真正能够完成真实世界中的复杂任务,AI 必须摆脱对文本信息的依赖。视觉信息,如屏幕界面、图表、文档、物理环境等视觉信号,往往是 AI 处理真实世界任务的信息来源。

随着 2026 年初 OpenClaw 的爆火,Agent 被真正的拉到用户的面前,强大的自动化和处理问题的能力顿时受到了全世界追捧。

那么,阶跃在 2024 年重仓多模态,就显得颇有前瞻性。

多模态的技术积累为后续 Agent 转型提供了技术基础。这种 " 感知 + 决策执行 " 的结合路径,让阶跃在 2026 年具备了较强的差异化优势。

2026 年 1 月,旷视科技联合创始人印奇正式出任董事长,进一步加速了阶跃的 Agent 转型。

印奇负责顶层战略和终端商业化落地,创始人兼 CEO 姜大昕继续主抓技术研发。旷视系的计算机视觉基因与阶跃原有的多模态技术实现了良好协同。转型成果在 Step 3.7 Flash 上得到了集中体现。

Step 3.7 Flash 发布于 5 月 29 日,总参数 198B,包括 196B 的语言骨干和 1.8B 的 ViT 视觉编码器。但是 Step 3.7 Flash 每次推理激活参数仅约 11B,最高生成速度超过 400 Tokens/s。

在主流评测平台上,Step 3.7 Flash 展现出较强的实用性能。

根据大模型测评网站 Artificial Analysis Intelligence Index 数据显示,Step 3.7 Flash 整体得分为 43 分,处在国内大模型中上游水平。评分细节上,Step 3.7 Flash 在速度和输入价格上显著占优;在语言冗长问题上是较大的短板;在智能方面,即逻辑能力、代码生成、学习、上下文关联等方面能力虽并不突出,但依然处在第一梯队。

而在对 Agent 能力方面的考核上,Step 3.7 Flash 的表现就显得更专业对口:用于测试 Agent 执行基准的 ClawEval-1.1 给出的评分是 67.1 分,大幅领先 DeepSeek V4 Flash 的 59.8 分。

阶跃星辰实现这一性能的核心在于稀疏 MoE 架构。MoE 通过路由机制让模型在推理时只激活少量专家子网络。

与传统 Dense 模型相比,MoE 在推理阶段优势显著。根据微软 DeepSpeed-MoE 论文,在提供同等质量输出的情况下,优化后的 MoE 模型推理成本最高可便宜 9 倍,速度最高可达 4.5 倍或更强。在 Step 3.7 Flash 上,每次推理激活的参数仅约 11B,但最高生成速度超过了 400 Tokens/s,达到了接近更大 Dense 模型的实用效果。

够快,够用,也够便宜,Step 3.7 Flash 在生产端 Agent 为阶跃找到了第二条路。

并非 " 免死金牌 "

资本市场上,阶跃也正在迎接密集的追捧。

2026 年初,公司完成超 50 亿元人民币 B+ 轮融资,刷新了中国大模型赛道单笔融资纪录。随后,阶跃开始推进 Pre-IPO 轮融资,累计融资规模近 25 亿美元。

包括腾讯、启明创投、上海国投先导基金、国寿股权及华勤、龙旗、中兴等产业资本纷纷入局,阶跃星辰目前已完成股份制改造并拆除红筹架构,计划于 2026 年 6 月底前向港交所递交上市申请,有望在年底前成为继智谱 AI、MiniMax 之后的中国大模型 " 第三股 "。

资本市场狂热的原因也很简单,有故事、有技术、又有 " 钱景 "。

故事上,Agent 的重要性自不必多言。技术上,作为 " 多模态最强卷王 ",阶跃在手机 UI 理解、图像视频生成、语音交互等领域表现突出,被视为最适合手机、汽车、智能终端等场景的 AI 底座。

钱景上,阶跃被曝出已于吉利、OPPO 等厂商开展合作。阶跃的多模态模型全面接入 OPPO 的智能助理 " 小布助手 ",阶跃联合吉利汽车与千里科技,打造的智能座舱已在吉利银河 M9 上量产搭载。因此,阶跃 2025 年收入达到近 5 亿元,预计 2026 年实现营收 12 亿元。

然而阶跃给自己挣来的,只是第二次与对手搏杀的机会,并不是一张免死金牌。

众所周知,To B 的业务比 To C 难做,尤其是大模型方面。贵自然是一方面,安全、隐私问题是另一方面,还有一个重要的原因是合作企业的流程和节奏。阶跃或许可以每月迭代一款模型,但对于合作伙伴,尤其是他们的技术、合规、产品部门来说,跟上这么快的 OTA 节奏,这几乎是不可能的任务。

并且,阶跃并不能保证未来的合作完全排他。吉利可以接入豆包,OPPO 也可转投他人。就如同此前苹果 AI 手机,最初被传称国内版 AI 服务商是百度,后又被传出苹果在接触千问的消息。

所以,再次回到战场的阶跃依然躲不过技术、用户、资本和声量上的正面冲突。

(图源:X)

有意思的是,模型发布一个星期左右,Step 3.7 Flash 在 Hermes 上就出现了 " 串台 " 问题。根据网传截图显示,用户可以通过一系列操作,看到其他用户的操作内容。

虽然现在无法确定问题出在 Step 3.7 Flash 或 Hermes 上,还是这是二者在调度、对接上存在的问题。但此类事件一旦发生在极其注重隐私的手机场景,和安全性高于一切的汽车上,对企业来讲都是一场灾难。

但无论如何,阶跃星辰重回战场。它面对的,是更加激烈的角逐。

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容