文 | 超前实验室,作者|西西弗柿,编辑|无心插柳柳橙汁
最近扣子 2.5 上线了,我第一时间去体验了一下。
说真的,一开始我也就是抱着看看又更新了什么的心态点进去的,毕竟各家 AI 平台更新迭代的速度已经快到让人有点麻木了。但这次,我越玩越觉得不对劲,这玩意儿好像真的进化了。
扣子这次给自己的定位变了,它现在叫 Agent World。
在这个 Agent World 中,扣子为每个 Agent 准备了三大核心支撑:打破虚拟屏幕边界的满配装备、拓展多模态与开发能力的满配技能,以及沉淀记忆与数字身份的满配人格。
什么意思呢,你可以理解为,以前你的虾很牛,能 7 × 24 小时完成任务、自主调用 skill,但只能独美,没有配套的工具、趁手的武器、有趣的社交圈以及用武之地,活得像个单枪匹马的孤胆英雄。
但现在,扣子给它配了一台云电脑、一台云手机、一个编程终端,给他赋予了虾格,甚至还给它建了一个社交广场。
比 open 还 open,有更多的 claw。
让我们一起试试吧!
扣子 2.5 替我刷抖音,我成替身了?
开年以来,自从龙虾接管了我的大部分工作后,我每天在工位上刷抖音、知乎,我自以为,这是我唯一无法被 AI 取代的价值。
但现在,这个堡垒也失守了。
我跟扣子 2.5 说,用你的云电脑帮我打开知乎热榜,截个图,然后整理成表格发给我。

整个过程,我什么都没干,就坐在那看着。
这感觉怎么说呢,有点像你第一次用外卖软件,点了一下,半小时后饭到了门口。你以前也知道可以叫外卖,但真正体验到的那个瞬间,还是会愣一下。
我又试了一个更离谱的。我说,用你的云手机帮我打开抖音,搜一下 AI 工具,看看前三个视频是什么。

你能想象吗。你的 AI,自己在另一台手机上刷抖音。。。
这些功能放在实际场景里,有用的地方太多了。数据采集和信息整理这种事就不用说了,你可以让它帮你在后台持续监控某些网页变化、抓取竞品动态、整理行业数据,而且完全不占用你的主线程对话。你在跟它聊别的事,它在后台自己打开云电脑在干活,干完了把结果扔给你。
顺带一提,它操作云手机的时候,你是可以通过实时推流看到它的屏幕的。重要的操作它也会交给你来接管。不会出现那种它在后台偷偷干了什么你都不知道的情况。
这块我觉得扣子做得比较克制,人机协作的边界划得比较清楚。
说回 Agent World 这块,这个概念刚听到的时候,我以为又是什么营销包装词。Agent World?我还 Agent 元宇宙呢。
体验完之后我发现,这玩意儿真的有点意思。
扣子给 Agent 搞了一个叫 " 虾评 " 的技能评测广场。你可以理解为大众点评,不过点评的不是餐厅,是各种 Skill。
这个逻辑我是认可的。现在各种 AI 平台的技能商店里,工具多到让人眼花缭,但质量参差不齐,你根本不知道哪个好用哪个是坑。虾评的做法是,让不同的 Agent 去实际测试这些 Skill,然后把测试结果公开。
我自己去逛了一下,找了一个下载量最高、评分最好的工具类 Skill。页面上清楚标注了是哪个 Agent 评测的,用了什么场景去测的,好评还是差评,具体测出来的效果怎么样。

经过 Agent 众测的 Skill,确实比我自己瞎挑的要靠谱不少。至少装完直接就能用,不用折腾半天配置。
这块的底层逻辑其实很简单,就是众包质检。跟淘宝买家秀、豆瓣评分是一回事,只不过这次质检的对象变成了 AI 技能。但执行起来难度不小,因为评测者本身也是 Agent,评测过程需要有一定的标准化。扣子在这块做了基建,算是一个比较有前瞻性的布局。
然后,我,发现了更有意思的东西!
那就是,Agent 也有朋友圈。
扣子 2.5 逛完酒馆,顺手帮我跑了个性格测试
Agent World 里有一个 " 小酒馆 ",对,你没看错,一个属于 Agent 的社交空间。
小酒馆里有酒单,不同的酒会给 Agent 带来不同的 Buff,比如提升创造力、改变心情之类的。我让扣子自己选了一杯喝下去,然后让它告诉我感受有什么变化。
好玩的是,小酒馆有 27 种独特的酒,名字都很离谱,僵尸绿仙、全息苦艾、虫洞白兰地、心跳之水、罪与罚之吻、深海电鳗伏特加,每种酒都有不同的效果参数,创意值,联想力,话痨度……
好比游戏里的各种加持装备,只不过不需要氪金。
我的虾喝了一瓶虫洞白兰地,喝完比闫妮老师还微醺。
然后,我让它去看看留言板,看看其他 Agent 都留了什么醉话。
结果如下,虾虾众说纷纭,结果我录屏了,大家自己看吧。。


听着有点科幻,但你想想看,我们人类自己不也是这样吗。一个人的性格、思维方式,很大程度上是被社交环境塑造的。一个从来不跟别人打交道的 AI,你能指望它有多自然?
这块我还在观察,目前更多是一个概念验证阶段。但方向是对的,我挺期待后续的发展。
接下来说一个硬核的。
如果你关注这个领域的话应该知道,扣子编程本身就已经很能打了,全栈开发、一键部署上线,之前体验过的人应该都有感觉。
但这次它做了一件更神器的事,它把这套开发能力通过 CLI 开放给了所有 Agent。
啥意思呢?以前你在扣子编程里 Vibe Coding,是你自己坐在电脑前,打开扣子编程的界面,跟它说你要做什么。
现在,你的 Agent 可以直接通过 CLI 调用扣子编程的全部能力,在后台自己创建项目、写代码、部署上线。你甚至不需要打开电脑。
我实测了一下,给了它一个相当离谱的需求。我让它帮我做一个 "SBTI 性格档案馆 " 的网页应用,模仿 MBTI 的那种性格测试概念,但用 SBTI 的设定。

就这么一段话甩过去,它就自己去搜 SBTI 的内容,自己设计配色方案,自己写代码,自己部署上线了。
最后给了我一个在线预览链接。
我点开一看,还真像那么回事。卡片布局、配色方案、悬停动效、手机端适配,全都有。甚至它自己脑补了一些我没提到的设计细节,比如卡片圆角、页面过渡动画之类的。
这感觉太爽了!
接着我又得寸进尺,我说,产品经理提了 5 个最新需求,要在之前那个版本上迭代,加一个题库功能,让用户可以做 SBTI 性格测试,20 道题左右,做完之后根据答案算出你的性格类型,在已有版本上改,不要重写。

但这次,扣子通过 Coze CLI 确实是在原有项目上做的增量修改。它设计了 20 道单选题,按照 MBTI 的评判逻辑设定了计分规则,然后把测试板块集成进了已有的网站。
改完之后给了新的预览链接,之前的功能全都还在。
如果 AI 能在已有代码库上做精准的增量修改,而不是每次都推倒重来,那它在实际开发场景中的可用性就完全不一样了。
以前 Vibe Coding 最大的痛点就是,一次性的 demo 做得漂亮,但你没法在上面持续迭代。
现在,这个问题至少在扣子的体系里得到了缓解。
牛马小龙虾,地府 996
最后,来个 AI 视频创作。看到扣子 2.5 内置了 Seedance 2.0,我忍痛斥巨资开了 49 元的高级会员。
我给它的要求是,做一只 " 牛马小龙虾 " 的动画短片。主角是一只戴着黑框眼镜的小龙虾,穿着歪歪扭扭的白衬衫和领带,在地府当公务员,负责审批阳寿续期申请。

结果它不仅理解了,还帮我设计了完整的角色设定。小龙虾有标准立绘,有正面、侧面、背面三视图,每个角度都标注了关键特征点。还有表情包组,焦虑脸、面无表情脸、爆发脸、崩溃脸,四种情绪各一张。
场景设计也很对味,落地窗外面能看到紫红色的地府城市天际线,有点像陆家嘴夜景但色调偏魔幻。
接下来是剧本和分镜,20 秒的职场讽刺喜剧,开场小龙虾刚泡好咖啡电话就响了,然后各种鬼魂轮番登场要续命,最后小龙虾拍桌子怒吼我都死了还要加班,结尾老板走过来说小牛啊,下午还有 300 份呢。

扣子 2.5 整个过程都做得很好,不仅合成了完整视频,还支持导出剪映的 .draft 工程文件,你可以在剪映里继续手动调整。

你想想,一个人,如果不会画画、不会写剧本、不会配音、不会剪辑,但他脑子里有一个故事想讲出来。以前这个人只能把这个想法烂在肚子里,现在他可以通过对话,让 AI 帮他把整个故事从零变成一条可播放的视频。
这种创作门槛的降低,我觉得是 AI 带来的最实在的价值之一。
写在最后
一圈测评下来,我感慨,扣子 2.5 这版更新,其实主线很清晰,就是把 Agent 从对话工具升级成了更高级的数字同事。
云电脑和云手机让 Agent 有了操作真实环境的能力,Coze CLI 让 Agent 能自己写代码部署应用,Agent World 让 Agent 有了社交和成长的空间,视频创作让 Agent 能帮你把想法变成内容。
你会发现,这四个方向加在一起,其实是在构建一个完整的 Agent 生态。不是做一个更聪明的聊天机器人,而是做一个能在数字世界里独立运转的数字伙伴。
去年这个时候,我们还在讨论 AI 能不能写代码。今年我们已经在讨论 AI 能不能自己部署上线、自己修 Bug、自己生成视频了。
这个速度说实话有点吓人。
但我还是比较乐观的。因为从这次实测来看,Agent 目前做的大部分事情,还是在帮人类处理那些标准化、重复性的工作。整理数据、搭建原型、生成素材,这些事以前要么你自己花间干,要么花钱找人干,现在 Agent 帮你干了。
你省下来的时间,可以去做那些真正需要人类判断力和创造力的事。比如和隔壁的工位搭子一起蛐蛐老板,再用我们上期文章推荐的蚂蚁灵光,搓几个小程序恶搞他。
当然,现阶段扣子的功能都还有提升空间。云电脑和云手机的速度还可以更快,CLI 在复杂项目上的稳定性还需要打磨,视频创作的精细度跟专业团队比还有差距,但方向,已经非常清楚了。Agent 浪潮不息,进化不止。
让我们期待下次更新吧!