关于ZAKER Skills 合作
钛媒体 22小时前

美国机器人三巨头特斯拉、Figure、1X,正在把竞争带向“ Physical AI ”

文 | 具身商业前哨

" 中国机器人和美国机器人之间的差距,不是越来越小,反而越来越大了。" 一位机器人本体厂商的产品负责人对「具身商业前哨」表示。

这句话听起来有些刺耳,但并非没有道理。

就在国内还在讨论融资、量产和价格时,特斯拉、Figure 和 1X 已经把问题推进到另一个层面:机器人的竞争正在走向 "Physical AI"。

近期,我们梳理了特斯拉、Figure 和 1X 在技术路线、核心部件、制造体系以及商业化落地上的信息。一个明显变化是:海外头部机器人公司正在弱化单纯的本体参数,更加强调 AI 大脑、世界模型、VLA 模型、端侧推理、真实数据闭环,以及规模化制造能力。

这是一个明显的信号,人形机器人不再只是一个会动的机器,而正在成为 "AI 进入物理世界的入口 "。

特斯拉:打造人形机器人的基础设施

特斯拉正在把自身能力,从电动车制造延伸到 Physical AI 平台。其最大的优势,不是 Optimus V3 的本体,而是它背后那套已经被自动驾驶验证过的 AI 基础设施,正在开始落地到机器人领域。

马斯克最近在财报会上也提到,Optimus V3 不愿意过早公开展示,因为竞争对手可能会逐帧分析并复制。特斯拉最新计划在 7 月底或 8 月初启动 Optimus 的量产。

今年 4 月,特斯拉下一代 AI 推理芯片 AI5 受到持续关注。按照特斯拉的长期规划,这类 AI 芯片不只服务汽车,也会服务 Optimus 以及未来更大规模的 AI 计算需求。

行业人士分析:特斯拉做机器人,并不是只做一个机械本体,而是在围绕 "AI 如何进入物理世界 " 搭建底层基础设施。

" 别人是在训练机器人,特斯拉更像是在训练 Physical AI。" 行业人士分析,特斯拉的优势包括数十亿英里的 FSD 真实道路数据、长期积累的视觉感知和世界模型训练经验、自研 AI 芯片和端侧推理体系、超算和训练基础设施、软件栈和制造体系协同能力。

在核心部件层面,虽然外界很难获得 Optimus V3 的完整参数,但从目前曝光的信息和官方的公开表述来看,至少有几个方向值得关注。

第一,Optimus V3 的整体身高仍在 173cm 左右,但体重有望进一步减轻 20%,姿态和运动方式会更接近真人,总自由度预计超过 50 个。

第二,触觉传感、皮肤材料、零部件集成度和电池续航能力,都会继续升级。这些变化是为了更方便量产、更稳定工作。

第三,新一代灵巧手可能拥有 22 个自由度,更接近真人手掌比例,并具备力反馈和指尖触觉传感能力。

灵巧手也是特斯拉反复推迟 Optimus 展示和量产节奏的重要原因之一。行业人士表示,人形机器人最难的部分,往往不是让它走起来,而是让它稳定、可靠、低成本地完成真实工作。

在商业落地上,特斯拉是为数不多同时造汽车和机器人的超级平台,所以这也是马斯克敢于提出要把 Optimus 的售价压低在 2 万美元的底气之一。

据公开报道,弗里蒙特相关产线的远期目标年产能可达 100 万台;德州超级工厂后续也被规划为更大规模的机器人产线,长期目标年产能高达 1000 万台。

按照长期规划,Optimus 初期将重点满足特斯拉内部工厂需求,大幅替代人工完成重复性和危险性任务。摩根士丹利发布的一份报告指出,如果特斯拉用 Optimus 机器人替换其 10% 的员工,将节省高达 25 亿美元的成本。

这也是为什么,马斯克会把 Optimus 视为特斯拉未来最重要的增长曲线之一。特斯拉做 Optimus 是在搭建一套 AI 进入物理世界的基础设施。

Figure:让 AI Agent 在真实世界落地

如果说特斯拉的优势来自自动驾驶、芯片和制造体系,那么 Figure AI 的特点,是它更像一家原生的 Physical AI 公司,而不是传统机器人公司。

Figure 的目标是交付一款真正通用的人形机器人:一种能够执行类人任务,并直接向人类学习的机器人。

它很少把传播重点放在关节参数、扭矩、自由度、负载这些硬件指标上。Figure 更愿意讲 Helix、VLA 模型、多任务泛化、自然语言理解、推理能力,以及机器人如何完成连续任务。

美国科技媒体分析:Figure 的野心是把 AI Agent 落地到真实世界中。

据了解,Helix 模型依赖超过 100 万小时的模拟与实地数据训练,试图把视觉、语言和动作打通。人说一句话,机器人看见环境,理解任务,再把理解转化为动作。

在技术路线层面,Figure 坚信自研 VLA 模型以及神经网络端到端控制,可以让机器人具备更强的 sim-to-real 泛化能力。

它采用的是 " 快慢脑 " 的双系统架构。慢脑负责 " 思考 ",理解自然语言指令和复杂场景语义;快脑负责 " 行动 ",将慢脑的意图转化为毫秒级的精准动作,控制机器人完成全身运动和手部操作。

更重要的是,Figure 还在尝试机器人之间的协作能力。两台机器人可以通过观察对方动作,实时推断意图并配合完成任务。多机器人协作开始进入 Physical AI 的训练范畴。

在核心部件层面,Figure 03 专门围绕 Helix、家庭场景以及规模化制造重新设计。它配备了重新设计的传感套件和手部系统,以更好地支持各类复杂任务。

Figure 03 身高约 173cm,整机约 61kg,全身拥有 35 个自由度。外部采用织物材料和软泡沫包裹,这一设计明显更适合家庭环境。

在断网或部分关节轻微损毁的情况下,Figure 03 仍具备一定工作能力。整体续航约 4 到 5 小时,采用脚部无线感应充电方式。灵巧手加入摄像头和触觉传感器,目标是进一步接近人类水平的灵巧操作能力。

在商业化层面。Figure 官方披露,BotQ 工厂已将 Figure 03 的生产效率从每天 1 台提升到每小时 1 台,未来四年累计生产目标为 10 万台。

同时,Figure 没有完全依赖外部制造商,而是将电机、电池、关节等关键部件纳入内部生产,以便降低成本、控制质量、加快迭代速度和提升效率。

对于 Figure 来说,每一台出货的机器人,也是一台数据采集终端。机器人在不同家庭、不同商业场景中遇到的新任务,都可能成为下一版 Helix 的训练素材。

通过先进感知、触觉智能、家庭设计和大规模制造准备能力的结合,Figure 正在构建一个能够在家庭和商业环境中学习、适应并工作的机器人平台。

1X:让家庭成为 Physical AI 的训练场

相比特斯拉和 Figure AI,1X 的路线更激进。NEO 机器人不是先去工厂搬箱子,而是进入真实家庭,完成整理衣物、收拾厨房、整理沙发、递送物品等任务。它更坚决地把家庭当成训练 Physical AI 的真实场景。

更加值得注意的是,1X 可以被视为 OpenAI 在具身智能和人形机器人方向的重要外部押注之一。

在技术路线上,1X 发布的 1XWM,是一个基于互联网视频预训练的生成式世界模型。它的核心不只是让机器人识别物体,而是让机器人形成对世界的理解,并在此基础上持续学习与行动,以推动 NEO 的规模化部署。

这就是 1X 路线里最有意思的地方。它试图让机器人通过看视频学会新动作。比如,你给它看一段叠衣服的视频,它就有机会学习类似动作。之后,NEO 还可以通过 OTA 更新获得新能力。

如果遇到不会做的事,1X 的操作员可以远程接管,手把手教它。等它学会之后,下次就有机会自己完成。这套机制的本质,是把家庭变成一个持续生成数据、持续训练模型、持续迭代能力的真实环境。

在核心部件上,NEO 身高约 168cm,体重约 30kg,采用柔性 3D 晶格外壳包裹全身。它的噪声控制被设计得很低,续航约 4 小时,能够识别人类手势和表情。灵巧手拥有 22 个自由度,同样采用腱驱动系统。它比其他机器人更轻,也更适合家庭环境。

再看商业落地。根据 1X 官方披露,海沃德工厂正在向年产 1 万台 NEO 爬坡。随着自动化更新推进以及圣卡洛斯新工厂逐步投用,公司目标是在 2027 年底达到年产 10 万台。

NEO 的价格方案包括 2 万美元买断,或者每月 499 美元订阅。据媒体报道,1X 首年 1 万台计划产能在预售开启后短时间内售罄。

AI 的智能来自多样性,不是来自重复。这句话几乎可以概括 1X 的路线。它不是先把机器人训练到完美,再送进家庭;而是让机器人进入真实家庭,用真实家庭环境反过来推动 AI 能力突破。

机器人竞争走向 " 谁更懂现实世界 "

人形机器人的竞争,正在变成三件事:谁能把 AI 大脑和机器人身体真正打通?谁能获得足够多、足够真实、足够多样的数据?谁能把机器人从 demo 推向可制造、可交付、可持续迭代的产品?

特斯拉、Figure、1X 这三家公司路径不同,但都指向同一个判断:人形机器人未来的核心,是 AI 能不能通过这副身体理解现实世界、适应现实世界,并最终改变现实世界。

这也是中国机器人公司接下来必须面对的问题。中国机器人行业过去几年跑得很快,供应链、成本、工程化和量产速度都有优势。

但如果竞争维度从 " 本体能力 " 升级到 "Physical AI",双方的差距就会体现在模型、数据、芯片、算力、软件栈和真实场景闭环等层面。

如果没有这一层能力,量产越快,可能越像是在更快地把自己推向硬件代工的位置。

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容