five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Trainings首发机械臂操作多模态数据集 上线HuggingFace 支撑机器人控制与轨迹学习研发

五号数据雷达开源数据市场2026-05-15 02:1011
专业AI训练数据集服务商Trainings依托LeRobot项目发布面向机器人控制场景的多模态数据集,于2026年5月14日首发上线HuggingFace,可广泛应用于机械臂轨迹学习、精细化操作控制等算法研发场景,为具身智能落地提供标准化数据支撑。

当前随着具身智能产业进入落地攻坚期,面向工业场景的机器人控制算法研发对高质量、标准化的场景化训练数据需求持续攀升。由于机械臂操作数据需要同步采集运动状态、多视角视觉等多维度信息,采集成本高、标注规范不统一,一直是制约中小研发团队算法迭代的核心瓶颈之一。近日,专业AI训练数据集服务商Trainings依托LeRobot项目正式发布全新机械臂操作数据集rollout_record-test_boli_20260514_093038_20260514_150923,该数据集于2026年5月14日首发上线HuggingFace平台,面向全球开发者开放使用,主要面向机器人操作控制、机械臂轨迹学习领域提供数据支撑。

据公开信息显示,该数据集是专门针对机器人控制任务打造的多模态数据集,包含1个完整任务episode、1602帧有效数据,总结构化数据文件大小为100MB,配套视频文件大小为200MB,帧率为30fps,符合机器人控制算法训练的主流数据采集标准。存储层面,结构化数据采用行业通用的parquet格式存储,视频采用兼容性极强的MP4格式存储,开发者无需进行额外格式转换即可快速接入训练流程,大幅降低数据预处理成本。

数据维度方面,该数据集覆盖动作(action)和观测(observation)两大核心特征:其中动作维度包含6个核心控制维度,分别对应肩部平移、肩部升降、肘部弯曲、手腕弯曲、手腕旋转、夹爪位置,完整覆盖6轴工业机械臂的全链路动作控制需求;观测维度不仅包含与动作维度完全对齐的机器人实时状态数据,还同步采集了侧视、俯视两个视角的480x640像素3通道RGB图像,可支撑多模态感知控制算法的训练需求。此外,数据集还配套了完整的时间戳、帧索引、episode索引、任务索引等元数据,方便开发者进行数据筛选、时序对齐等操作。值得关注的是,该数据集遵循Apache 2.0许可证,开发者可免费用于商业或非商业研发场景,进一步降低了研发团队的使用门槛。

从应用场景来看,该数据集可广泛应用于多个具身智能研发方向:一是可用于机械臂轨迹学习算法的预训练,开发者可基于数据集的完整任务轨迹训练模仿学习、强化学习算法,提升机械臂在复杂路径下的运动精度,适用于工业分拣、零部件转运等场景的算法研发;二是可用于视觉引导下的机器人精细化操作控制研发,同步的多视角视觉+动作状态数据可支撑多模态融合控制模型的训练,实现机械臂对操作对象的动态识别与自适应操作,可应用于精密元件组装、小件物品抓取等场景的算法验证;三是可作为行业基准测试数据集,用于不同机器人控制算法的效果对比评测,助力统一行业评测标准,推动机器人控制算法的迭代升级。

作为垂直于机器人领域的场景化训练数据集,本次发布的数据集填补了细分任务下标准化多模态机械臂操作数据的供给空白,为广大中小研发团队降低了数据集采集的高昂成本,对于加快机器人控制算法从实验室验证到产业落地的迭代速度,推动具身智能、工业机器人产业的规模化落地具有积极意义。

查看rollout_record-test_boli_20260514_093038_20260514_150923

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们