关于ZAKER 合作
Connie Loizos 15小时前

机器人新突破:Physical Intelligence 发布 π 0.7 模型,展现泛化能力

总部位于旧金山的机器人初创公司 Physical Intelligence(物理智能)近日发布了一项名为 π 0.7 的新研究。该研究表明,其最新模型能够让机器人完成从未明确训练过的任务,这一能力甚至让公司内部研究人员感到意外。

π 0.7 模型是公司在实现通用机器人 " 大脑 " 这一长期目标上的重要一步——即一个能够通过自然语言指导完成陌生任务并实际执行的系统。如果这些发现得到验证,它们可能意味着机器人人工智能正接近一个拐点,类似于大语言模型领域的突破。

论文的核心主张在于 " 组合泛化能力 ",即将不同环境中学习到的技能结合,解决模型从未遇到过的问题。目前,机器人训练通常依赖于特定任务的数据收集和专用模型训练,而 π 0.7 打破了这种模式。

" 一旦它跨越了从仅能完成数据范围内的任务到能够以全新方式重新组合事物的门槛," 联合创始人兼加州大学伯克利分校教授 Sergey Levine 表示," 其能力的增长速度将远超数据量的线性增长。"

最引人注目的演示涉及空气炸锅。尽管训练数据中仅有两个相关片段,模型却成功烤出了红薯。研究员 Lucy Shi 指出,这表明机器人可以在新环境中通过实时指导改进性能,而无需额外数据收集或再训练。

然而,团队也坦承了模型的局限性。例如,在早期实验中,空气炸锅的成功率仅为 5%,但经过半小时优化提示后跃升至 95%。此外,模型目前还无法根据单一指令自主完成复杂多步骤任务。

缺乏标准化基准使得外部验证变得困难,但团队将 π 0.7 与之前的专用模型进行了比较,发现在制作咖啡、叠衣服等复杂任务中表现相当。

Levine 回忆起研究人员首次看到 GPT-2 生成关于安第斯山脉独角兽故事时的情景:" 它到底是在哪里学到秘鲁有独角兽的?这是一个非常奇怪的组合。" 他认为,机器人领域出现类似现象尤为特别。

尽管如此,批评者指出语言模型可从互联网中学习,而机器人则受限于此。对此,Levine 反驳称,真正具备泛化能力的系统虽然不如特技演示戏剧化,但却更实用。

截至目前,Physical Intelligence 已筹集超过 10 亿美元资金,估值达 56 亿美元。据悉,该公司正在讨论新一轮融资,估值或将接近110 亿美元

图片来源:Physical Intelligence

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容