关于ZAKER Skills 合作
autocarweekly 48分钟前

自动驾驶不是具身智能的上半场

文|三少爷

" 自动驾驶是具身智能的上半场,具身智能是自动驾驶的下半场。" 这个论断在业内广为流传,顺滑得让人几乎忘了追问,这个金句真的经得起推敲吗?

经常做深入逻辑思辨的小伙伴们可能会发现,上、下半场的说法制造了一种逻辑惯性,藏着一个偷换概念的思维陷阱:它把 " 先后发生 " 偷换成了 " 因果必然 "。这种思维陷阱其实并不新鲜,在智能电动汽车这个赛道,电动化就曾经被广泛宣传为智能化的上半场,仔细思之,这个观点其实并不成立。

毕竟,油混、插混乃至燃油车,搭载高阶智驾的比比皆是。电动化推动了智能化的跃迁,但智能化并不以电动化为不可逾越的前提。具身智能也是同样的道理。自动驾驶人才的涌入让 " 下半场 " 的说法有了事实基础——但它不能反过来说明,具身智能必须以 AD 为上半场。

元能力的平移

" 具身智能是自动驾驶的下半场 " ——这句话是成立的,它刻画的,是一场大规模的人才迁徙和元能力的平移。从 AD 赛道冲杀出来的人,正携带着被量产工程淬炼出的元能力,集体涌入具身智能的新疆域。这点正由一批批响亮的名字反复印证。

最典型的案例是理想系。理想汽车前 CTO 王凯、前智驾技术研发负责人贾鹏、前智驾量产负责人王佳佳,三位在理想并肩打过几年硬仗的老兵,共同创立了至简动力。贾鹏的履历本身就是一部 AD 人才迁徙史——他 2016 年成为英伟达中国智驾团队一号员工,2021 年加入理想带领团队从零自研智驾,在 2023 年完成城市 NOA 量产、2025 年初端到端双系统交付后,转身扎进了具身智能的深海。

地平线系的下海潮同样批量涌现—— 005 号员工余轶南创办了维他动力,智能座舱产品线总经理牛建伟创立叮当动力,前视觉感知技术负责人黄冠创办极佳视界。据统计,地平线至少有 14 位核心技术和管理层离职创业,其中 13 人进入了具身智能赛道。

他们带走的,不是某个可复用的模型代码,而是在 AD 战场上锻造出的全套 " 肌肉记忆 ":如何定义复杂问题,如何在不确定性中拆解任务,如何在严苛的资源约束下做关键取舍,又如何在一个长达数年的开发周期里,维持团队的纪律与信心。

AD 领域的具体知识——某个算法实现、某个特定调优技巧——或许会随技术换代迅速贬值。但 AD 过程所锤炼出的元能力——对算法开发与部署的掌控力、跨域协同的工程力、将技术从 Demo 推向量产的执行力——却是实实在在的硬通货。

这就像 AI 时代的学习:我们记住具体知识的速度早已追不上机器,但我们习得的 " 如何学习 " 的能力本身,依然长期具备真正的价值。贾鹏起步于英伟达自动驾驶部门,从一个纯算法人员成长为 " 无论聊芯片、硬件、软件系统还是算法都能跟上 " 的架构师,这种跨越层级的系统视角,正是人才元能力最精确的注脚。因此,具身智能是自动驾驶的下半场的论断,说的是,AD 人带给具身智能的,是人的元能力,是那些在 AD 战场上千锤百炼而成的、做成事情的底层惯性与方法论。

技术的鸿沟

" 自动驾驶是具身智能的上半场 " ——这句话说的是另一件事:它把 AD 当成了具身智能的技术基础,暗示做过 AD 自然能做具身。但两者从一开始,核心能力的要求就截然不同。

AD 要解决的核心问题只有一个:安全的导航移动。它的关键能力是环境感知、路径规划和碰撞规避——一切为了 " 从 A 点安全移动到 B 点 "。具身智能则需要同时解决三大问题:导航移动(走到哪里)、运动控制(怎么完成奔跑、跳跃等动作)和灵巧操作(怎么抓、拧、摁)。导航移动只是具身智能的入场券,运动控制和灵巧操作才是具身智能面临的两大核心挑战。

正因为能力要求如此不同,AD 和具身智能在传感、执行、模型等层面存在巨大的差异。

首先是传感。

AD 的传感器配置收敛到了 " 摄像头 + 毫米波雷达 + 激光雷达 " 的组合——扫描百米外的路面,识别车辆和行人,精度到厘米级即够用。具身智能的传感器则是一张远为复杂的清单:除了同样的视觉传感器,还需要六维力传感器(感知手指和物体的接触力矩)、触觉阵列(感知材质和滑移)、IMU 惯性单元(维持全身平衡)、关节编码器(实时反馈每个关节的角度和速度)。不光是种类多,精度要求也差了数量级——触觉传感器的力分辨率必须达到 0.01 牛顿,相当于一根头发丝掉到手指上的力度;灵巧操作需要在毫米级空间内施加毫牛顿级的力控,拧螺丝劲大了滑丝、劲小了拧不进去;数据采集更要求亚毫米级的物理精确性和微秒级的多模态时间同步。

其次是执行。

AD 的动作输出是轨迹规划——方向盘打多少度、油门踩多深。本质上,它在控制一个高度抽象化的物理系统——四个轮子的速度矢量。具身智能的执行则分成两道完全不同的题。下半身是运动控制:四足机器人需要在非平坦地面上动态平衡,双足机器人需要协调几十个关节完成行走、奔跑乃至后空翻。上半身是灵巧操作:拧一颗螺丝需要手指在毫米级空间内施加精确到毫牛顿的力——劲大了螺纹滑丝,劲小了拧不进去。

第三是模型。

在这个维度上,AD 和具身的差距可能比传感和执行更大。

AD 的模型范式已经在快速收敛,具身智能大模型当前连范式都没收敛—— VLA、世界动作模型(WAM)、联合嵌入预测架构(JEPA)、端到端强化学习,几条路线各说各话,没有哪个被证明明显优于其他。更根本的难题在于:具身智能的模型和本体是深度绑定的。AD 的模型解决了 " 怎么开 " 的问题后,可以部署在几乎任何一辆四轮车上,但具身的本体千差万别——双足人形和轮式双臂的动力学方程完全不同,灵巧手和物理夹爪的控制策略不在一个维度上。在范式突破之前,在当前本体多样化的阶段,没有一个通用模型能覆盖所有构型。

破壳机器人创始人许华哲的判断一针见血:" 具身智能不是机器人学、不是自动驾驶——是物理 AGI 新物种 "。AD 是一个为了 " 安全移动 " 这一单一目标而高度特化的子集,具身智能则是面向通用物理交互的全新系统。把子集当作全集的基础,是方向性的误判。因此,自动驾驶是具身智能的上半场这一句不成立:从 AD 到具身,需要跨越的不是一条小马就能趟过去的河,而是一片广袤的大陆。

根本就没有上半场

如果 AD 真的是具身智能不可或缺的上半场,那么,逻辑推论应该很清晰:从未涉足 AD 的公司,理应在具身赛道上举步维艰。但跑在最前列的几家明星公司,恰恰构成了有力的反证。

宇树科技是这条反证链条上最硬的代表。王兴兴 2016 年 8 月创立宇树,比国内 AD 产业爆发早了整整五年。从早期 Go1 四足机器人到 20 台 G1 登上 2026 年春晚同步完成弹射、大回环、连续翻滚,宇树的元能力来自十年死磕四足动力学——关节要多少力矩、重心什么时候转移,这些问题的答案不在任何一篇 AD 论文里。

智元机器人则是另一条路径。2023 年 2 月,稚晖君从华为离职创立智元。三年后,智元 2025 年出货量达到 5168 台,超过宇树成为全球人形机器人出货量第一,用 3 年走完了宇树 10 年走的路。智元的元能力来源并非 AD 赛道降维,而是极客工程执念加上一整套华为大厂训练出的组织方法论——前华为副总裁邓泰华是真正的操盘者,管理团队中有一大批华为 23 到 24 级的老将。

宇树和智元这两条线,一条是十年死磕硬件,一条是三年操盘生态——没有一条经过 AD。它们共同指向一个简单结论:元能力的来源是多元的。AD 带来的系统工程能力是宝贵的一支,但极客的破局力、硬件死磕者的长期主义,同样能在具身智能的土壤中长出强大的根系。

写在最后

从 AD 涌向具身智能的人才潮是真实的,但这股潮水冲过来的,是 AD 人被量产工程淬炼出的元能力:定义问题、拆解任务、在严苛约束下做关键取舍的底层惯性。不是模型,不是算法,不是任何一个可以在两个行业间直接搬运的技术模块。如果技术真能无缝迁移,机器人赛道恐怕早已跑步进入成熟期了。

于是,真正的问题变成了另一个:那些从 AD 战场走来的战士,带着他们珍贵的元能力,在新赛道上,跑得过那些从十年死磕硬件、从极客工程、从更早的机器人产业中拿到了同样能力的人吗?要知道,元能力只是入场券,而能不能走到终点,永远取决于在新战场上的创新力与执行力。

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容