在虚拟 Agent 时代,模型依托文本、图像与视频数据实现跨越式发展,语言智能、视觉智能走向成熟。
但当 AI 真正进入物理世界、要让机器人像人一样灵巧干活时,需要在 open-world 场景、有交互的处理多样类型的任务。
所以从更底层能力来看,具身智能需要的不只 video/language 层面,而是在真实生活中认知、行动、产生交互,并根据物理反馈持续思考与迭代。
这就意味着具身智能需要学习的,不是一段视频,而是在真实生活中、自然多样的 Human Data。
今天,简智正式发布 Gen DAS Dex(以下简称 Dex)—— 实现人手全模态感知与行为的高精度重建,并与 Ego 配合,革新 "Human Data" 数据范式,为具身智能提供覆盖 " 头 + 手 " 全场景、精细化、可直接训练的灵巧行为数据底座。
01 为什么今天的具身智能,需要 Dex 这样的 " 手 "?
人类五指经过数百万年进化,形成 27 块骨骼 + 34 块肌肉 + 24 个自由度的精密结构,是面对复杂、多样灵巧操作的 " 通用接口 ";同时现实生活中大量五指操作,也为模型训练提供了丰富的样本与实例。
那么如何将手的行为转化为可被理解、训练的数据,面临的是多维度的叠加挑战:
1. 高质量、自由度的灵巧手数据极度稀缺:多是视觉片段,缺少关节角度、且指尖空间精度停留在 2-3cm,误差大,有效数据供给远不及产业需求。
2. 多模态无法兼备、对齐:视觉、动作、触觉不完整、不同步,时序错位、空间不准, downstream 模型难以训练、无法泛化。
3. 采集设备与自然动作冲突:笨重、遮挡、负重感强,导致动作变形,数据失真,无法长期大规模采集。
4. 头和手独立存在,而非形成 " 认知 + 行为的闭环 ":仅靠头视角:看得见,却摸不准,精细操作彻底失效,或者只有手摸得准,却看不全,全局操作极易出错。这些无法构成人行为的物理交互的时空闭环。
5. 无法规模化,走出实验室:遥操、动捕等方式都需要巨大成本布置场地,无法进入生活、进入户外。

简智 Dex 要解决的,正是这个断层。
02 Gen DAS Dex 到底带来了什么?
Dex 不只是一只 " 数据手套 ",而是一整套把人类双手行为与感受,转化为机器可理解、可训练、可泛化的采集终端。它与 Ego 协同,首次实现 " 头 + 手 " 全链路、全模态、高精度、低延迟的数据闭环,输出可直接喂给模型的结构化数据。
1. 全自由度覆盖,逼近人手生理极限的灵巧还原
面向最复杂的精细操作,Dex 用仿生轻量化外骨骼,完整支持人手 23 个自由度检测,接近人手生理全部自由度。无论是指尖捏取、指节弯曲、掌心开合还是手腕扭转,都能完整捕捉,让机器第一次学到人类真实的 " 手怎么动 "。
2. 行业顶级精度,为模型迭代筑牢真值根基
精度,决定数据用来训练的效率与价值。
自研磁编码器实现 0.02 ° 关节角检测,且外骨骼结构使得在温变与环境扰动下偏差极小,无需频繁校准;
搭配高精度 IMU 与 Ego 红外 + 视觉多重定位,最终达成 mm 级指尖定位。每一个微操作都有真值,让模型训练告别 " 模糊估计 "。
3. 行业最全单设备模态,补齐触觉 + 视觉双核心
单一视觉永远学不会物理交互。Dex 做到真正多模态合一:
指尖搭载高精度磁触觉传感,灵敏度 0.05N,空间分辨率 1mm,清晰捕捉抚摸、抓取、按压的物理反馈;
手背 / 手下方配置 150 ° 超广视角摄像头,与 Ego View 互补,无死角记录抓取全过程。视觉看 " 怎么做 ",触觉懂 " 用多大力 ",数据价值直接翻倍。

具身智能最痛的,是 " 头看的 " 和 " 手做的 " 对不上。解决这一问题,不能只通过云端 " 拼凑 " 与对齐,而是需要从硬件开始就着手解决,
Dex 通过 SUB G 无线协同,统一控制相机快门、曝光、IMU 采样等全设备时钟,实现多源数据亚毫秒级对齐。头部视角、手部动作、触觉信号完全同步,让 " 眼手 " 协同数据真正可训练、可复现。
5. 无感穿戴设计,让采集像戴手套一样自然
动作自然,数据才真实。
自研磁编码器微型化至 3mm,整机体积与普通滑雪手套相当;
合金 + 弹性聚合复合材质,重心优化,整机仅 210g;长时间佩戴、连续复杂操作、精准抓取都无负担,彻底避免 " 为采集而演戏 "。
6. 全场景规模化采集,本地端压缩 / 质检,让效率提升两个数量级
Dex 从设计之初就为量产数据而生:
结构自适应,适配不同手型;
Ego+Dex 穿戴即采,无需基站、无需场端设备;
语音交互控制,单次续航超 3 小时;
自动流式无线传输,3 分钟完成采集上传全链路,数据采集效率提升 100 倍。让大规模、低成本、全天候、真实场景的数据生产成为可能。

如果说互联网数据成就了语言与视觉大模型,那么人类真实物理交互的数据,将成就具身智能。
Dex 的意义,远不止一款硬件:
它第一次用单设备实现手部全自由度 + 高精度 + 触觉 + 视觉 + 头手同步的一体化采集;
它把 " 经验采集 " 从实验室搬到日常场景,让数据可规模化、可标准化、可互通复用;
它与 Ego 协同,共同定义 Human Centric 数据新范式,为具身世界模型提供最核心的 " 头 + 手 " 行为数据源泉。

写在最后
简智 Dex 的发布,是具身智能数据基建的关键一步。我们不再满足于让机器人 " 动起来 ",而是要让机器人学得会、做得稳、用得自然。以 Dex 为采集入口,以全模态高精度数据为燃料,以头手协同为骨架,一个可持续积累、持续迭代、持续泛化的物理智能时代,正在到来。让机器人,从学习人类的双手开始。