2026 年过半，具身智能 CEO 们在聊什么？

文 | 镧瞳 AI

6 月 13 日，2026 北京智源大会具身产业 CEO 论坛会场座无虚席，连过道都站满听众。

5 场主题演讲 + 一场圆桌论坛，当前具身赛道最炙手可热的明星公司 CEO 们齐聚在同一会场，是这个产业早期玩家的 " 狭路相逢 "，亦是生态关联方的 " 互联互通 "。

智平方郭彦东、星动纪元陈建宇、光轮智能谢晨、蚂蚁灵波朱兴、破壳机器人许华哲、千寻智能韩峰涛、灵心巧手周永、星源智刘东，过去两年，他们各自的公司获得了令传统行业望尘莫及的资本估值和发展速度，也亲历了技术迭代的曲折、产能的艰难爬坡与商业化未来的反复推演。

这个年轻赛道的 " 华山论剑 "，年轻的 CEO 们表达显然也尚未 " 收敛 "。他们对行业现状的复盘、对技术路线的甄别以及对未来趋势的预判，集中反映了当下国内具身智能产业的主流认知与前沿思考，而在创业公司，CEO 们的思考深度和角度，往往也决定着公司的未来。

以下为我们整理编辑出的本次论坛各位 CEO 观点实录，希望能成为行业早期的珍贵资料。

智平方郭彦东：世界模型不是 VLA 的竞争路线，而是 VLA 体系中的核心组成部分

通用智能机器人不仅是一种特定的装置、特定的设备，基于跨场景使用，它将是继 PC、手机、（智能）汽车之后一个非常了不起的智能终端。

机器人能够从事的工作越来越多，它不再是为了一个单一任务而存在，它有更便捷的交互，而且能够跨场景跨任务去使用，所以它会成为一个革命性的智能终端。

机器人要想工作其实离不开一个非常核心的问题，它需要几个要素：1、强大的大脑，它一定要像人一样聪明，能够感知环境，听懂指令，执行操作；2、灵巧操作，必须要有这种双臂的协同，去像人一样在各种环境当中操作多种的设备；3、能够在环境当中完成自主的移动，移动的方式可以是多种多样的，但是一定要有完成自主移动的这样一个能力。

怎么样才能构建一个强大的机器人的大脑？从第一性原理上来讲，我们认为：机器人的大脑需要完成的事情有两个，第一个就是它的输入，需要能够对环境的信息做全方位的感知以及全维度的感知，并且能够理解人的指令。

那到底应该用世界模型还是用 VLA 模型，VLA 模型会不会被世界模型所取代，它们到底是什么关系？当前被广泛讨论的 " 世界模型 "，本质上并不是物理规律驱动，而是靠海量数据训练出来的。数据足够多，模型就知道水杯越过桌面会下落、手机屏幕用力敲可能会碎——这不是物理规律的总结，而是大数据学习的结果。

基于这个理解，我认为，VLA 是多种模态融合的大数据驱动的端到端模型架构的总称。在这个定义下，世界模型与 VLA 没有本质区别，更不是替代关系。世界模型解决的是对物理环境进行稠密、包含时间维度的 4D 预测，它是一个非常好的空间基础模型，是 VLA 空间感知的一部分，能帮助机器人大脑越来越好。

世界模型不是 VLA 的竞争路线，而是 VLA 体系中的核心组成部分；而在世界模型与 VLA 融合之后，类脑架构将成为下一代机器人大脑的重要演进方向。

星动纪元陈建宇：具身机器人应该具备像人类一样的 " 智能性和通用性 "

具身机器人未来具备潜在的万亿级的市场，这已经成为共识。

具身机器人的价值主要体现在两个方面：第一个是它会极大提高生产力，帮助我们去更好地去生产咱们现有的这些终端产品。第二，机器人本身也可能成为这样的智能终端。继个人电脑、智能手机、智能汽车之后，可能是以某种家用机器人的形态存在。要做到这一点，再延续传统机器人的范式就不行了。

传统机器人已有超过 70 年的历史。但是，它有两个致命问题：一是上限非常低，智能性不够，只能做相对重复简单的动作，大部分稍微复杂一些的事情，它是做不了的。第二个是通用性非常不够的，传统机器人硬件和软件都是专用的，你要做一个新的事情，你必须要重新去打造硬件，打造整套软件的系统。那么我们希望是什么？

我们希望是打造能像人一样上限又高又通用的机器人，打造这样的一种通用机器人，需要同步打造大脑和本体才能实现。当前具身智能公司仅仅做单点技术还是不够的，要比拼的是整套系统能力，是从大脑到本体到场景这样的一个协同进化的飞轮。

光轮智能谢晨：数据不是燃料，是物理 AI 的教育系统

过去几年，人工智能的发展主要发生在数字世界。大语言模型依靠海量文本、图像和视频数据完成训练，并通过题库、用户反馈和在线交互不断迭代。但当 AI 走向物理世界，问题变得完全不同。机器人不仅要理解语言和图像，更要在真实环境中行动，处理材料、接触、摩擦、形变、空间约束和任务结果。这意味着，物理 AI 需要的不只是更多数据，而是一套能够让机器人持续学习、持续评测、持续改进的基础设施。

AI 行业的 " 卡脖子 " 问题，它的底层逻辑在转换。整个具身、物理 AI 我们认为最终的关键是在数据上。数据是具身智能 " 卡脖子 " 难题。物理 AI 的数据需求，我认为会是自动驾驶的 1000 倍。

在我们看来，机器人学习不能停留在一次性数据集上。人类的学习不是一次性完成的，而是在经验、反馈和实践中持续发生。机器人也一样。它需要从真实世界获得经验，通过评测理解自己的能力边界，再在真实部署中发现新的问题，并把这些反馈带回下一轮训练。这个过程，本质上就是一个持续学习的过程。

行业里之前习惯把数据叫成 AI 的燃料。我们始终认为数据本质上来讲应该是持续的教育系统。物理 AI 所需要的，不只是达标的数据供给，而是全生命周期的持续提供高质量数据、有效反馈与认知增量的学习系统。越复杂的任务，越需要更有经验的数据来定义问题、暴露短板，并帮助模型持续提升。

因此，我们提出 " 物理 AI 教育系统 " 的概念。它至少包含三个关键要素。

第一是数据，也就是机器人学习的 " 经验 "。这既包括人类在真实世界中的操作经验，也包括在仿真环境中生成的合成数据。人类数据的价值，不只是告诉机器人 " 物体在哪里 "，而是让模型理解人如何操作物体、如何处理复杂物理交互、如何面对失败与纠正、如何完成长程任务。仿真数据则可以把这些真实经验放入可控、可复现、可泛化的环境中，生成更大规模、更丰富分布的数据。

第二是评测，也就是机器人学习的 " 反馈 "。今天具身智能发展中一个非常关键的瓶颈，是缺乏高质量、可规模化、可复现的评测体系。大语言模型可以通过题库和用户反馈持续改进，自动驾驶可以依靠量产车队和 Shadow Mode 获得大量反馈，但机器人目前还没有天然的大规模反馈网络。真实世界评测成本高、周期长、安全风险大，也很难覆盖足够多的任务和失败模式。因此，仿真评测会成为物理 AI 规模化发展的关键路径之一。

第三是部署，也就是机器人进入真实世界后的持续学习。机器人不是在实验室训练完成之后就结束学习，恰恰相反，真实部署会带来更多复杂问题：不同场景的差异、不同设备的约束、不同任务流程中的异常情况，都会成为下一轮数据生成、模型训练和评测优化的重要来源。只有把部署反馈重新带回数据和评测系统，机器人能力才能形成持续迭代。

今天，物理 AI 仍处在非常早期的阶段。行业还需要更统一的数据标准、更开放的硬件接口、更可复现的评测体系，也需要更多模型团队、机器人公司、硬件厂商和场景方共同参与。

蚂蚁灵波朱兴：泛化不足本质是数据问题

具身智能拥有广阔的未来空间，但聚焦今年来看，应该还是在相对单一的、简单的场景中进行小规模商业化试点。

当下，物理 AI 面临多重挑战，主要表现在三个方面。首先是传感器出发的感知困境，如何让机器人看的更清楚，摸的更明白是感知要解决的核心问题；其次是高动态交互，这是具身智能与物理世界交互的最大挑战；最后是泛化性不足的问题，泛化性的挑战本质上是数据的挑战。

对于数据问题，大家不能只谈数据规模，质量和分布同样重要。去年，蚂蚁灵波在市场上大规模了解真机数据的时候，发现模态质量、重复度等一些基本的情况还是比较糟糕的。同时，随着模型范式的不断演进，不同阶段需要不同的数据配方。

但是看下一阶段，我们坚信还是以人为中心的数据将成为数据的核心。因为，基于这类数据可能会催生新一代的物理原生基础模型。

破壳机器人许华哲：家庭场景最有可能迭代出通用具身智能

尽管家庭场景中机器人面临很多挑战，但家庭场景具有丰富的数据维度，让它有机会迭代出真正的通用具身智能。真正的通用泛化是被数据定义的，这个数据一定是存在于泛服务场景。家庭的数据具有非结构化、多任务切换、高动态、多样本物体等特点，数据多样性几何级暴增。这样的场景下，通用具身智能才有可能出现。

破壳机器人希望能够系统重构全球家庭生态，定义未来人类全新生活方式，主要是通过三个方面实现：

一是机器人本体，打破传统本体出发的模式，我们坚持从 AI 角度重新定义本体，从数据出发，看本体能否将数据用好，能否可以把菜做出来。

二是 AI 模型，我们目标直指通用物理世界模型的终局形态，依托该模型，机器人可在各类通用场景中实现能力泛化。

三是物理世界智能体，这也是当前具身智能领域布局较少、却至关重要的方向。就像日常所见的小龙虾一样，我们希望智能体能在真实物理环境中串联各类任务、主动发现并提出问题、自主完成能力迭代升级。

灵心巧手周永：实现机器人造机器人产业才算进入 1.0 阶段

技术成熟本身是一个相对概念。举个例子，智能手机时代，富士康单日量产 40 万台手机，这就是产业走向成熟的典型表现。放到当下的机器人领域，我将行业成熟度划分为三个发展阶段：

第一阶段，目标是机器人制造机器人。目前机器人本体仍以人工组装为主，产品一致性难以保障。一旦实现机器人自主生产本体，将会大幅压缩制造成本。我们计划在未来 1-2 年内落地 " 机器人造机器人、智能体进化智能体 " 的目标。达成这一阶段，我认为机器人本体的成熟度可以达到 60 分，算作行业 1.0 版本。

第二阶段是 AI 自主设计 + 机器人自主生产。由智能体承接用户需求，全程依靠 AI 完成机器人设计，再由机器人落地制造，整个流程无需人工介入。实现这个目标，本体成熟度就能达到 80 分。

第三阶段则是趋近完全成熟的形态，成熟度可达到 95 分以上。届时机器人将实现高度模块化，例如，一个机器人交付到客户手里，如果客户在实际应用中发现有哪些不满意、提出优化需求，机器人可自主完成配件更换、外观调整，比如自行更换外壳、电机等部件，两小时内就能完成迭代并恢复使用，具备极强的自主适配、快速响应能力。

千寻智能韩峰涛：现阶段具身智能模型不宜大规模进场景干活

现阶段不宜急于大规模切入落地场景。可以开展小范围场景探索，与客户协同打磨场景认知，以此反向优化硬件与数据链路，但规模化落地需暂缓。

目前机器人难以规模化推广，核心卡在部署成本过高：现有模型完成演示版本，仅后训练、微调就需要一两个月，完全无法支撑批量落地。

当前具身智能模型尚处于起步阶段，能力像是一两岁的孩子。与其仓促推向场景，不如优先深耕基座预训练、打磨基础能力。就像培养孩子的时候，我们会先让孩子系统学习成长，而不是让他早早外出务工。我们判断，至少两年后，行业才具备大规模落地的条件。

星源智刘东：基座研发与场景落地需要并行推进

我们认为在训练基座模型的同时，必须同步挖掘可落地的场景点位。

实验室环境会屏蔽大量真实工况，有时候模型在实验室表现很好，落地到实际场景中的时候却很容易出现各类问题。从实验室验证到真实场景跑通，本身就需要 1-2 年周期。提前下场实战验证，既能修正模型训练方向、避免技术走偏，也能积累实战经验。

参考自动驾驶行业的经验：早年行业都冲刺高阶自动驾驶 L4/L5，反而是聚焦 L2 方案的玩家落地更快、市场收益更高。因此基座研发与场景落地需要并行推进，不能脱离实际场景闭门研发。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

2026 年过半，具身智能 CEO 们在聊什么？

宙世代

一起剪

相关阅读

Linux 7.1正式发布：终于搞定NTFS原生读写！

169元！长城阿基米德KM16机箱上架：无立柱270°全景侧透设计

远超国标一级能效！单联瑜发文晒小米空调今年做的最重要三件事：更多友商会用抽真空监管

国产自研高端仪器实现重要突破 我国类器官制造有了智能生产线

朱啸虎五连投 世航智能创海洋机器人融资纪录

格力CMO炮轰友商营销：空调一晚只用一度电、15分钟抽真空等都是骗局

DeepSeek V4.1灰度测试：代码能力大提升 天差地别

2026年上半年，460亿砸向具身智能，只“养肥”20家企业？

渠道再变革，家电618增长在即时零售？

美的转型，还差一口气

“驱蚊神器”单日爆卖6万单，有商家在百亿红海“闷声发财”

荣耀X80 Pro Max将于6月22日发布 配备11000mAh电池

vivo X Fold6影像、屏幕双双堆料！首发蔡司APO超级潜望长焦、顶级内外双屏

液冷服务器概念震荡反弹 意华股份、淳中科技双双涨停

影石杀进腹地，大疆先递诉状

最新评论

钛媒体

热门推荐

企业资讯

国产自研高端仪器实现重要突破我国类器官制造有了智能生产线

朱啸虎五连投世航智能创海洋机器人融资纪录

DeepSeek V4.1灰度测试：代码能力大提升天差地别

荣耀X80 Pro Max将于6月22日发布配备11000mAh电池

液冷服务器概念震荡反弹意华股份、淳中科技双双涨停