five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

清华联合北通院发布Dexora Dataset 百万级多模态数据支撑机器人灵巧操作与跨具身泛化研究

五号数据雷达开源数据市场2026-05-20 05:4213
2026年5月19日,清华大学联合北京通用人工智能研究院等机构在预印本平台arXiv首发大规模双臂双手灵巧操作数据集Dexora Dataset,可为视觉-语言-动作多模态模型提供仿真与真实场景互补的训练资源,破解高自由度双臂机器人操作领域数据稀缺、仿真到现实迁移难的行业痛点。

当前,具身智能被视为人工智能产业下一阶段的核心发展方向,而高自由度双臂机器人的灵巧操作能力、不同硬件平台间的跨具身泛化能力,是通用人形机器人落地工业制造、生活服务等场景的核心技术瓶颈。长期以来,该领域面临真实场景训练数据稀缺、仿真数据与现实场景适配性差、数据标注标准不统一等痛点,严重制约了相关技术的迭代速度。2026年5月19日,清华大学联合北京通用人工智能研究院等机构在预印本平台arXiv首发的Dexora Dataset,正是瞄准这一行业痛点推出的核心数据基础设施。作为国内首个大规模双臂双手灵巧操作专项数据集,Dexora Dataset旨在为视觉-语言-动作多模态模型提供真实世界与仿真互补的高质量训练资源。

据披露,该数据集总规模覆盖10万条模拟轨迹(约650万帧,对应361小时视频内容)和1万条真实遥操作演示数据(约292万帧,对应40.5小时采集内容),所有数据均来源于通过混合遥操作系统采集的双臂双手36自由度机器人操作记录。为保障数据的高保真度与场景适配性,数据集创建过程采用仿真-现实协同策略,通过外骨骼背包与无标记手部追踪技术实现动作数据的高精度采集,所有数据均遵循LIBERO-2.1标准进行规范化处理,可直接适配主流具身AI模型的训练流程。

从应用方向来看,Dexora Dataset可覆盖机器人灵巧操作、跨具身泛化等核心研究领域的训练需求:在灵巧操作方向,该数据集可为复杂零部件装配、精细物品分拣、家政服务操作等多场景的双臂协同动作训练提供数据支撑,解决了过往单臂数据集无法覆盖多肢体协同任务的缺陷;在跨具身泛化方向,仿真与真实场景互补的数据结构,可帮助模型大幅降低“Sim2Real(仿真到现实)”的迁移成本,让仿真环境中训练完成的动作模型能够快速适配不同硬件参数的实体机器人,大幅降低具身AI产品的落地门槛;此外,标准化标注的多模态数据也可为视觉-语言-动作多模态大模型的训练提供支撑,帮助模型建立自然语言指令、环境视觉感知与实体操作动作之间的精准映射关系,推动通用人工智能相关研究的落地。

作为数据要素在具身智能垂直领域的典型高价值资产,Dexora Dataset的发布填补了国内双臂灵巧操作大规模标准化数据集的空白,也为全球具身AI领域的学术研究与产业落地提供了统一的训练数据基准,有望加速高自由度双臂机器人、通用人形机器人等领域的技术迭代,推动相关成果快速落地智能制造、养老服务、应急救援等多元场景,为数字经济与实体经济的深度融合提供新的技术支撑。

查看Dexora Dataset

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们