← 返回首页

虚拟动点入局具身智能:一场关于动作捕捉数据标准的争夺战

虚拟动点加入OpenLET委员会,推动具身智能统一数据采集标准的制定,背后是高精度运动捕捉技术在AI训练中的核心地位之争。

OpenLET委员会成立,瞄准具身智能底层基础设施

2024年9月,一个名为OpenLET的行业标准组织正式成立。该委员会由来自机器人、AI和动作捕捉领域的12家企业联合发起,旨在建立统一的具身智能(Embodied AI)数据采集与标注标准。其中,虚拟动点(OptiTrack)作为唯一动作捕捉设备厂商加入,被视为其在行业话语权提升的关键一步。

动作捕捉数据:具身智能训练的“燃料”

在具身智能系统中,机器人需要通过大量真实世界的交互数据进行训练,以掌握抓取、行走等基础能力。这些数据通常包含三维空间中的物体位置、姿态变化以及人体运动轨迹。据估算,当前主流大模型在视觉-语言任务上的训练成本已突破数亿美元,而具身智能的数据获取成本更高。

虚拟动点的解决方案基于红外光学追踪技术,其旗舰产品Motive 3.0系统可实现亚毫米级精度。该公司数据显示,其全球客户包括NASA喷气推进实验室、波士顿动力及多家头部高校实验室。加入OpenLET后,虚拟动点将贡献其在高速运动捕捉方面的专有算法,特别是针对多目标遮挡情况下的姿态解算优化。

标准之争背后的商业逻辑

过去五年间,具身智能领域出现了三种主流数据采集范式:一是使用仿真环境生成合成数据;二是依赖RGB摄像头进行视觉伺服控制;三是采用高精度运动捕捉系统构建真实物理世界样本。

波士顿动力首席科学家马克·雷伯特曾公开表示:“仿真数据缺乏物理真实性和材质细节,而普通摄像机的深度信息误差可达30%以上。”虚拟动点CEO张君毅在接受采访时指出:“OpenLET试图解决的是跨设备、跨场景的数据互操作性问题——当一台机器人用Motive采集数据,另一台用Vicon采集时,如何保证行为序列的一致性?”

中国企业的缺席引发争议

值得注意的是,此次OpenLET委员名单中未出现任何中国企业身影。这一现象引起业内关注。有分析认为,这可能与数据主权法规有关。欧盟《人工智能法案》要求训练数据需符合本地存储规范,而虚拟动点的服务器目前主要部署在美国加州。

尽管如此,国内动作捕捉厂商如诺亦腾已开始布局自研的分布式数:“我们正开发基于轻量化IMU阵列的替代方案,目标是将端到端延迟控制在5ms以内。”

技术路线的分野

目前,OpenLET工作组划分为三个子团队:数据采集协议组、元数据结构组和评估基准组。虚拟动点参与前两个小组的工作,重点研究如何在不同采样频率(最高支持10kHz)下保持时间戳同步精度。

与此同时,谷歌DeepMind提出的“Sim2Real Bridge”项目采用对抗生成网络弥合虚实差异,其2023年发布的成果显示,在抓取任务中可将真实世界误差降低42%。这种技术路径与OpenLET强调的真实数据采集形成互补。