关于ZAKER 合作
科创板日报 3小时前

软件股抛售“导火索”又发新品:AI 代理组团上班 更擅长白领工作

财联社 2 月 6 日讯(编辑 史正丞)凭借一系列 AI 插件引发本周美股 "SaaS 末日 " 和科技股广泛抛售的美国 AI 明星公司 Anthropic,周四宣布推出旗舰大模型的最新版本 Claude Opus 4.6。

公司也放出豪言,在 AI 彻底改变软件编程行业的工作方式后,现在是时候进军更广泛的职场了

随着 Anthropic 的新品发布,多家金融服务公司的股价应声跳水。截至周四收盘,FaceSet 跌超 7%,创 2020 年 3 月以来新低;汤森路透跌超 5%,创 2021 年以来新低。

(FaceSet 周线图,来源:TradingView)

作为新版本最引人注目的新功能,Anthropic 发布了名为 "AI 代理团队"(agent teams)的功能,允许将单个较大型的任务拆分成若干分段工作,并交给不同的代理完成。

公司介绍称,这项功能允许用户协调多个 AI 代理协同工作。其中一个代理为 " 团队负责人 ",负责协调工作、分配任务并整合结果。"AI 员工 " 均各自独立工作,拥有单独的上下文窗口,还能互相通信——例如寻求 "AI 负责人 " 对某些操作进行审批。人类用户可以与每一个 "AI 员工 " 单独对话,提供额外的指示。

在实际应用中,用户也能尝试让 "AI 员工 " 并行处理相同的任务,并试图驳倒 "AI 同事 " 的结论,经过 "AI 辩论 " 得到更优的结果。

Anthropic 的产品主管斯科特 · 怀特表示,这个新功能相当于有一支才华横溢的人类团队为你打工。而将代理的工作细分,不仅能让它们并行协调,工作的速度也会更快。

Opus 4.6 的升级还带来了 100 万 tokens 的上下文窗口,意味着能够处理更大的代码库,或更加大型的文档,例如财务文件和研究报告。

在编程领域取得成功后,Opus 4.6 也将关注焦点转向更加广泛的白领日常工作,例如财务分析和研究,制作表格和 PPT 等。

在评估 AI 模型在金融、法律等知识工作任务表现的 GDPval-AA 测试中,Opus 4.6 比起行业次佳模型(GPT-5.2)多拿了近 10% 的分数。

同时在金融分析、计算机使用、工具使用、检索和代理式编程的专项测试中,Opus 4.6 也是行业领先的模型。

对于打工人而言,新版的 Opus 也将Claude 直接集成进 PowerPoint 软件中。所以现在用户可以在 Excel 中利用 Claude 处理复杂的数据,然后转入 PowerPoint 生成演示文稿。

怀特表示,在过去一年半的时间里,所有人都已经看到软件工程领域发生的转变:" 氛围编程 "(vibe coding )开始作为一个概念出现,人们开始能够仅凭自己的想法就能搞定事情。

他补充道:"我认为,我们如今几乎正在迈入一个‘氛围工作’(vibe working)的时代。"

相关标签
科创板日报

科创板日报

上交所科创板电报,股市行情报道

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容