当前,全球人形机器人、工业协作机器人产业正进入落地攻坚期,高标注质量、场景匹配度高的训练数据集,已成为制约机器人动作控制技术迭代的核心瓶颈,尤其是手部精细作业类场景,由于需要同步采集关节动作、视觉观测、时序标签等多维度数据,采集与标注成本居高不下,行业长期存在优质数据供给不足的问题。
2026年5月18日,技术厂商vibeyvibey正式在HuggingFace平台首发duct_tape_to_hand_dataset_v2机器人学专项数据集,该数据集基于开源机器人数据工具LeRobot打造,专门适配so_follower类型机器人的训练需求,可广泛应用于机器人动作模仿、视觉伺服控制等研发领域。
从数据集参数来看,本次发布的v2版本共包含15组完整训练集,累计收录5462帧有效标注数据,所有数据均可直接用于模型训练;为提升开发者调用效率,数据采用分块存储模式,单块容量为1000帧,结构化数据文件总大小为100MB,配套观测视频文件总大小为200MB,采集帧率为30fps,在保障时序精度的同时降低了传输与存储成本。
数据维度方面,该数据集覆盖三大类核心研发所需数据:第一类为机器人动作标注数据,包含肩部平移、肩部升降、肘部弯曲、手腕弯曲、手腕滚动、夹爪位置六大核心关节的动作参数,可直接为动作生成模型提供训练真值;第二类为观测状态数据,同步采集对应动作执行过程中的机器人关节实时位置,为动作闭环控制研发提供对照依据;第三类为视觉观测数据,为机器人前置摄像头同步采集的作业画面,分辨率为480x640,采用AV1编码,在保障画质的同时进一步压缩了存储体量,可直接用于视觉伺服相关模型的训练。此外,数据集还配套了完整的元数据体系,包含时间戳、帧索引、回合索引、任务索引等标注字段,可支持时序动作预测、多任务迁移学习等更多方向的研究需求。
值得关注的是,该数据集采用Apache 2.0开源许可证,开发者可免费将其用于非商业或商业研发场景,无需额外申请授权,大幅降低了中小研发团队的技术准入门槛。
从应用价值来看,该数据集可支撑多类机器人技术研发场景:在动作模仿方向,开发者可基于标注的动作序列,训练机器人复现粘胶带等手部精细作业动作,适配工业组装、设备运维、家庭服务等场景的作业需求;在视觉伺服控制方向,开发者可依托同步的视觉画面与动作真值,训练机器人通过实时视觉反馈调整动作姿态,提升复杂非结构化环境下的作业精准度与稳定性。此外,依托完善的多维度标注,该数据集也可拓展应用于机器人多模态感知、小样本动作学习、人机协作安全控制等前沿研究领域。
作为机器人细分场景的专项开源数据集,本次duct_tape_to_hand_dataset_v2的发布,既为so_follower类型机器人的研发提供了标准化的训练基础,也为机器人领域的数据集开源共享体系建设提供了参考样本,对推动机器人动作控制技术的落地迭代、完善数据要素在人工智能实体化场景的供给体系具有积极意义。
查看duct_tape_to_hand_dataset_v2





_1769672084863.jpg)