关于ZAKER Skills 合作
钛媒体 17分钟前

agent 进驻工作群,我们给豆包支的招,Claude 听进去了

文 | 字母 AI

AI 进群,已经不是什么新鲜事了。

Slack、钉钉、飞书、企业微信里,早就有各种 AI bot、智能助手和企业 Agent。它们在形态上也做了很多尝试,阿里的悟空偏企业级 Agent 工作平台,字节的飞书 aily 偏协同办公里的企业智能体,微信正在灰度测试的 " 小微 " 则更像超级 App 里的原生办事助手。

Anthropic 当然不是现在才意识到这个方向。

早在去年,Anthropic 就发布过 Claude 和 Slack 的整合。那时的 Claude 更像是一个接入工作流的 AI 助手,承担群聊问答、总结和协助沟通的角色。

但它最近更新的 Claude Tag,把 "AI 同事 " 这个概念往前再推了一步。

只要在工作群里 @Claude,它就能顺着授权上下文拆任务、调工具、跑流程、交结果。可以理解为,Claude Code 和 Claude Cowork 那种工作型 Agent 能力,被 Anthropic 塞到了群里。

Karpathy 直接说,Claude Tag 代表了 LLM UI/UX(用户界面 / 用户体验)的第三次重设计。

第一代是网站,第二代是 App,第三代则开始变成一个自包含、持久、异步的组织实体。

LLM 的形态从最初的聊天入口,到这里,真正变成了一个有身份、有权限、有上下文、有任务状态的 AI 同事。

AI 同事进群并不稀奇,关键是它能怎么干活。

@Claude:告诉我你能干啥

工作群里最让人崩溃的,往往不是没人做事,而是信息散得到处都是。

群里随口一提的工作,要翻很多地方才能拼凑出完整的信息——产品指标在数据看板里,客户反馈在工单系统里,技术问题在 GitHub 里,销售进展在 CRM 里,会议结论在纪要里,真正的讨论又散落在一条条群消息里。

你突然被老板或者同事 @了,最麻烦的不是先判断 " 现在要干啥 ",而是要花半天时间,搞清楚现在是什么状况。

Claude Tag 接的就是这种活。

按照 Anthropic 的说法,管理员可以把 Claude 加进指定 Slack 频道,给它授权相关工具、数据,甚至代码库。之后,频道里任何人都可以直接 @Claude,把任务交给它。

Claude 会顺着已有上下文,把任务拆成阶段,再调用可用工具逐步完成,最后把结果交回同一个讨论串。

它有几个非常重要的功能,也是让它更像一个 " 真人 AI 同事 " 的点睛之处:

首先,它是多人协作的。任何人都可以看到 Claude 的工作内容,并且可以从上次中断的地方继续对话。

其次,它会随着时间推移不断学习。无需反复从头解释,随着 Claude 在工作中的参与,它会逐步构建更多关于工作的背景信息。

再次,它会主动出击(很有工作积极性)。如果启用了 "ambient" 行为,Claude 会主动推送它认为你可能需要了解的任何信息,也能提醒那些长期无人跟进的任务。

最后,它是异步工作的。给 Claude 分配任务后,你就可以专注于其他优先事项,它会在一旁闷头干活,还能自行安排任务,自主地在数小时甚至数天内完成项目。

官方文档表示:如果你之前使用过 Claude Code 或 Cowork,那么 Claude Tag 对你来说应该并不陌生。

可以粗暴理解为,它把 Claude Code 装了个群助手的壳子,然后塞到了工作群里——只要权限给够,Claude Code 能干的,它也能干。

过去开发者在终端里使唤 Claude,现在所有人都能在工作群里 @Claude。

其中最基础的用法,是让 Claude 帮你 " 快速补课 "。

一个工作群聊了半天,消息已经刷了几十上百条,你手上的活还没干完,突然被 cue 了一下,有个新活要交给你。

以前你只能一条条往上翻,现在可以直接 @Claude 问它:" 这里刚刚决定了什么?还有哪些问题没解决?"

Claude 会把长长的讨论压缩成几件事:已经定下来的结论、还没解决的问题、相关负责人,以及下一步谁要做什么。

这项功能对我们打工人来说非常实用,谁要做什么,直接一目了然,省了很多麻烦。

你还可以让 Claude 直接帮你拉数据、或者做会前准备——任何需要翻看大量信息的事情,它都能帮你一键整理,给出清晰的回复。

另外还有一个特贴心的功能,值得专门一提:Claude Tag 可以管理那些长期没有精力处理的工作群,筛出真正需要人类审核的步骤。

很多人手上都有这种被设置成免打扰的 " 半荒废群聊 ":客服反馈、告警、工单、数据异常、线上事故……它们每天都有消息进来,但每条消息又不一定值得人立刻放下手头工作去处理,要是持续关注只会影响手头工作。

久而久之,低优先级事项越堆越多,真正需要解决的问题反而被埋没。

Claude Tag 适合做第一层筛选,把明显紧急的内容挑出来,把需要人工判断的部分单独 @给负责人。

对普通员工来说,这意味着少被无效信息打断;对老板来说,这意味着过去那些长期没人收口的碎活,有人帮你持续盯着。

我觉得这能算是 Claude Tag 最像 "AI 牛马 " 的地方:它可以守在那些犄角旮旯里,把真正需要人的工作捞出来。

毕竟,在工作场景里,AI 助手被用得最多的地方,不就是处理信息么?

但要只是处理信息,未免太屈才了一些——这可是 Claude 啊!

官方页面里有一个很典型的例子:群里有人报了一个 bug,说某个服务在 token 刷新时出现 502,另一个人直接 @Claude,让它 " 根据这条讨论修复 bug,并打开一个 draft PR"。

普通 AI 助手可能最多总结一下 bug 现象,或者给一个排查建议。但如果 Claude 拿到了代码库、工单和开发工具权限,它就可以顺着群里的 bug 描述去找相关代码,判断问题可能出在哪里,提出修复方案,甚至直接生成一个待审核的 PR。

要是单看官方文档中列举的那些功能,能理解上下文、能规划任务、能调用工具、能异步执行……每一个似乎都不新鲜。但因为是 Claude,所以很强。

并且它把这几个功能收敛到了同一个产品形态里——把强模型、上下文、工具调用、多阶段执行和团队协作,收敛成了一个 @Claude。

这种形态才是最值得学习的地方。

LLM 的第三种形态

此前我们讨论豆包时曾判断,AI App 想从轻办公走向重办公,关键就是进入多人协作场景。人类负责讨论和判断,AI 负责在讨论之后总结、查证和执行。

现在,Claude Tag 先把这种协作方式做了出来。

Claude Code 和 Claude Cowork 团队负责人之一 Fiona Fung 此前提到,Claude Code 用久之后,工程师越来越多地和自己的 agent 单独工作,反而会变成一种孤独体验。个人 Agent 让单个人变强,但也可能让工作更孤岛化。

而 Claude Tag 的逻辑刚好反过来——它不是把人从团队里带走,让每个人都躲进自己的 AI 窗口里单兵作战;而是把 Agent 拉到公共讨论现场。

人类先讨论、争论、碰撞,形成方向;Claude 再接住上下文,负责总结、查证、拆解和执行。

Karpathy 说的 "LLM UI/UX 第三次重设计 ",看起来是 LLM 的三种不同形态,背后其实也对应着 LLM 承接的不同任务。

第一代网站形态,LLM 承接的是问答。用户打开聊天框,问一个问题,拿一个答案。

第二代 App 形态,LLM 承接的是个人工作。它进入 IDE、终端、桌面和浏览器,帮一个人写代码、改文件、查资料、生成内容。

到第三代组织实体形态,LLM 承接的则是团队协作之后的执行。它不只是回答某个人的问题或者帮某个人完成任务,而是出现在团队讨论现场,把一群人刚刚形成的上下文、共识和待办,继续往前推进。

可以说,在第三种形态,当 LLM 开始从 " 工具 " 变成一个可以被 @的实体角色,它的功能也需要顺应着进化、变得更符合它的 " 身份 "。

很多企业 Agent 此前难落地的原因就在于此。它们看起来有企业级入口,也接了办公软件,但真正能承接的任务还停在第一代或第二代:要么只是问答和总结,要么只是个人效率工具。

但企业真正需要的是第三种能力——把团队讨论变成行动,把组织里的信息、决策和执行串起来。

Claude Tag 的启发就在这里,可以认为,未来企业 Agent 至少要往三个方向走:从个人 Agent 走向群组 Agent,从问答工具走向异步执行者,从功能堆叠走向能力收敛。

让 Agent 更像一个 " 高效率的人类员工 ",成为团队里那个能接住上下文、推进流程、持续收口的万能同事,才是企业 Agent 真正有机会落地的形态。

不过,对于大部分的企业 Agent 而言,距离实现这种产品形态还是有一定距离,主要有两方面原因:

一方面,功能还不够好。很多产品能总结会议、能查知识库、能写文档,但一旦进入复杂工作流,就很难真正闭环。

另一方面,模型也确实不够强。企业 Agent 不是会聊天就够了,它要理解复杂上下文、企业黑话、模糊需求、跨系统信息,还要能拆任务、调工具、处理异常……很多 Agent 演示时很惊艳,真进公司之后就容易变成 " 能做,但只能做一点,多了就降智 "。

模型做好了,哪怕自己不包装,也会有别的工具商帮你加壳,说到底,形态其实是锦上添花。

虽然它强,但它贵啊

当然,AI 同事进群以后,并不是老板终于捡到了免费牛马。

一个很现实的情况是:虽然 Claude 强,但它贵啊!

(图片由 AI 生成)

Anthropic 官方说,Claude Tag 目前运行在 Opus 4.8 上。按照公开 API 价格,Opus 4.8 的起步价是每百万输入 token 5 美元、每百万输出 token 25 美元。

但普通聊天是你问一句它回一句,企业 Agent 可不是这样。它可能要先读完一个工作群的历史讨论,再查工单,再翻 CRM,再看代码库,再跑数据分析,再写文档或生成 PR。每一步都会产生新的输入、输出和工具调用,也会把更多上下文继续带进后续步骤。

复杂 Agent 任务的 token 消耗远高于普通代码问答,尤其是 Claude Tag 这种产品,官方强调它可以异步工作,任务可能持续数小时甚至数天。它越像一个真正的 AI 同事,就越不可能只是便宜的群聊机器人。

如果一个公司只是偶尔让 Claude 总结一下会议,费用可能还好,但如果每个工作群都有一个 Claude,每个项目都让它长期盯着,对 token 的消耗简直如同开闸泄洪。

所以,AI 同事不一定比人便宜。尤其是当这个 AI 同事足够聪明、足够勤快、足够愿意加班的时候。

未来企业用 Agent,很可能不会把所有活都交给最强模型,更现实的做法是分层使用。

普通总结、分类、提醒,可以交给便宜模型;复杂分析、跨系统任务、关键客户、重要代码,可以交给 Claude 这样的强模型;涉及金钱、客户承诺、生产环境、权限变更的动作,则必须有人类确认。

你会让高薪聘来的指导专家帮忙搬桌子么?

这也是 Claude Tag 官方设计里很企业化的一点:管理员可以设置组织级和频道级的 token 花费上限,查看 Claude 执行过哪些任务,也能控制它能进哪些频道、用哪些工具、访问哪些数据。

换句话说,AI 同事也要有预算啊。咱不能只看 " 它能不能干 ",还得看 " 这件事值不值得让它干 "。

除了价格,另一个更大的问题是权限。

Claude Tag 最有吸引力的地方,是它能接入工具、数据,甚至代码库。可这也意味着,它不只是一个会聊天的 Chatbot,而是一个可能触碰真实资产的执行者。

AI 一旦进入公司工作流,能力问题很快就会变成治理问题。

过去很多自动化工具和 AI coding agent 被吐槽 " 删库跑路 ",本质上不是模型突然有了坏心,而是权限边界没有设计好。一个 Agent 一旦拿到过大的权限,又缺少确认、回滚和审计机制,它的错误就不再只是生成一段废话,而会变成真实世界里的损失。

企业 Agent 的价值从来不是证明 AI 同事可以无限自治,而是把 Agent 放在一个相对可控的位置:工作群里、讨论串里、管理员权限下、团队成员都能看见。

企业 Agent 比较现实的落地方式是,先让 AI 进入协作层,帮人总结、查证、拆解、提醒;再逐步进入执行层,调用工具、生成文档、提交 PR;最后才是更深的自动化。

AI 同事如果手握太多权限,错误很容易从文本世界进入现实系统——但 AI 可没办法像人类员工那样担责。

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容