机器人会跑会跳会唱,但距离真正走入千家万户,仍有关键一步尚未迈出——理解真实世界。要做到这一点,必须为机器人的 " 大脑 " 提供海量、真实的物理世界数据,让其学会感知、决策与执行。

4 月 16 日,由智元机器人孵化的具身智能数据公司觅蜂科技正式亮相。新公司定位为一站式物理 AI 数据服务平台,试图补上这一长期制约行业发展的数据短板。
"AI 从数字世界走向物理世界,正遭遇数据荒漠。" 觅蜂科技董事长兼 CEO、智元机器人合伙人姚卯青表示,此时组建具身智能数公司,正是希望推动高质量物理 AI 数据实现标准化供给," 像水电一样即取即用 ",为具身智能产业筑牢根基。
姚卯青介绍,与大语言模型相比,具身智能的数据积累仍处于早期阶段。以当前主流模型为例,训练类似 ChatGPT-5 级别的系统所需语料达百亿小时量级,而具身智能可用数据仅在 50 万小时量级,不仅规模差距悬殊,还存在标准缺失、质量不一、供需错配等问题。
更关键的是,数据获取方式长期受限。传统物理 AI 数据采集方式往往依赖定制化机械臂、专用传感器、固定工位等,不仅设备成本高昂、部署周期漫长,也难以覆盖真实世界中复杂多变的场景。
为此,觅蜂科技推出 MEgo 系列无本体数据采集硬件,包含采集夹爪、头戴式采集设备等。设备具备超 300 全景感知与亚毫秒级数据同步能力,通过可穿戴设备,普通人也可以在工厂、商超乃至家庭环境中完成数据采集,由此大幅降低数据采集门槛,拓展采集场景。

根据觅蜂科技的规划,相关硬件将于年内实现规模化量产。配套推出的一站式数据治理服务平台,可实现数据预处理、空间重建、数据质量评估、数据标注等功能,实现数据全流程自动化处理。
记者在觅蜂科技官网看到,其 " 数据市场 " 板块已上架 467 个具身智能训练数据,涵盖家居、工业、餐饮、办公等场景,其中既有真机数据,也有仿真数据,还有触觉数据。姚卯青表示,该板块类似数据展示 " 橱窗 ",便于客户预览样本。今年,公司的数据采集规模有望达到千万小时,并在 2030 年前向百亿小时级数据产能迈进。
除了数据供给,如何推动数据流通与标准统一,也是行业关注的焦点。为此,觅蜂科技联合上电科、国家数据标委会、工信部赛迪研究院等机构发起 " 蜂巢数据共创行动 ",北京人形机器人创新中心、上海国地中心等数十家海内外机构共同参与。
共创行动以 " 打破数据孤岛、统一数据标准、链接全球供需 " 为目标,打造开放高效的物理 AI 数据流通网络,让客户轻松找到数据,让服务商精准对接需求,实现数据价值高效流转。
同时,觅蜂科技还与京东云、百度云、阿里云、猎聘、贵州大数据集团、张江集团等达成战略合作,计划在数据生态、场景协同、算力支持与人才建设等领域展开深度合作,共筑物理 AI 数据产业新生态。
姚卯青说,通过这样的合作机制,一是推动行业标准和共识的形成,二是加强联合研究与交流,三是打通数据供给与需求之间的连接,让真正有价值的数据实现高效流转。