five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

YOLO2431在HuggingFace首发clean_up_table_v2_final数据集 填补双手机器人桌面操作训练数据缺口

五号数据雷达开源数据市场2026-05-25 00:407
2026年5月24日,AI开发主体YOLO2431在HuggingFace平台首发机器人学专用数据集clean_up_table_v2_final,该数据集基于雅马哈双手机器人桌面操作场景采集,包含多视角视觉数据与全链路运动参数,可直接支撑双手机器人操作、机器人模仿学习等方向的模型训练,为机器人实体化AI研发提供了高质量数据底座。

当前,全球人形机器人、柔性工业机器人赛道正进入技术落地的关键期,双手机器人作为具备复杂精细操作能力的核心载体,其AI模型的训练与迭代高度依赖同步包含真实运动参数、多视角视觉感知信息的高质量场景数据集。但目前全球公开市场中,面向桌面清理等高频通用操作场景的双手机器人专用数据集供给相对稀缺,成为制约中小研发团队技术迭代的核心瓶颈之一。2026年5月24日,AI开发主体YOLO2431正式在HuggingFace平台发布clean_up_table_v2_final数据集,为双手机器人操作、机器人模仿学习领域的研发提供定向支撑。

该数据集使用LeRobot创建,是专门针对雅马哈双手机器人(yam_bimanual)场景的机器人学领域数据集,整体包含300个完整的操作情节(episodes),总计246897帧数据,覆盖4类不同的桌面清理任务。所有数据以30fps的帧率采集,配套生成900个视频文件。数据集结构包含观测状态(observation.state)和动作(action)两类核心参数,均为32维浮点数组,具体特征覆盖左右机械臂的3D位置坐标、6D旋转表示、夹持器状态以及6个关节角度,完整还原双手机械臂操作的全链路运动逻辑。此外,数据集同步提供三个视角的视频观测数据:头部摄像头、左手腕摄像头和右手腕摄像头,每个视频分辨率为640x360,为3通道彩色视频,采用h264编码;配套元数据包含时间戳、帧索引、情节索引和任务索引,可直接对接主流机器人学习框架。据介绍,该数据集仅设置训练集(train split),所有300个情节均用于训练,数据以parquet格式分块存储,每个块包含1000帧,研发团队可直接调取使用,大幅降低数据预处理成本。

从应用价值来看,该数据集覆盖完整的桌面操作任务链路,其同步采集的多视角视觉数据与机械臂运动参数,可支撑多类典型研发场景:一是用于双手机器人模仿学习模型训练,让AI直接学习真实机械臂的操作轨迹与力度控制逻辑,有效降低模拟环境训练到真实场景落地的迁移偏差;二是用于多视角融合环境感知算法优化,依托三个不同位置的摄像头同步采集的数据,提升机器人对桌面物品位置、形态、材质的识别精度;三是用于复杂任务拆分策略研发,研究人员可基于4类不同的桌面清理任务数据,探索机器人对多步骤操作任务的自主拆分与决策能力。作为公开开放的高质量机器人专用数据集,clean_up_table_v2_final的发布是数据要素向人工智能实体化应用场景延伸的典型案例,将进一步降低双手机器人操作技术的研发门槛,推动服务机器人、工业柔性装配机器人等场景的技术落地,也为后续机器人领域数据集的标准化采集、开放共享提供了参考范式。

查看clean_up_table_v2_final

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们