当前,具身智能正成为人工智能领域的核心落地方向,双手机器人因可胜任精密装配、柔性分拣、复杂操作等多场景需求,是工业、服务业机器人迭代的核心形态之一。而高质量、多模态同步的标注数据集,是制约双手机器人模仿学习、自主控制算法迭代的核心瓶颈,行业内针对双手机器人场景的开源优质数据供给长期偏紧,此次新数据集的发布正是对这一行业需求的响应。
2026年5月12日,开源贡献者juyoungggg正式对外发布0512_setting_2nd双手机器人控制数据集,该数据集基于LeRobot开源框架构建,是专门面向双手机器人学习任务设计的专用训练数据集。据公开信息显示,该数据集共收录80个完整任务片段,累计包含103419帧同步采集数据,采样帧率为30fps,适配bi_so_follower类型双手机器人训练需求。
从数据构成来看,0512_setting_2nd数据集覆盖了多维度的机器人训练所需特征:包含12维动作向量,对应双手机器人左右手臂各6个关节的位置参数;12维观测状态向量,与关节位置参数一一对应可用于动作反馈验证;同时同步采集了三个不同视角的图像观测数据,分别来自左腕摄像头、右腕摄像头和右顶部摄像头,图像分辨率为480x640,采用彩色三通道格式,可支持多视角视觉感知算法训练。此外数据集还配套了时间戳、帧索引、片段索引、任务索引等完整元数据,方便研究人员按需调取、拆分数据。存储方面,数据集采用高效的Parquet格式存储,同时附带MP4格式的视频文件,适配不同研发场景的调用需求。
作为专门面向双手机器人场景的开源数据集,0512_setting_2nd可覆盖多个典型研发场景:可用于双手机器人模仿学习训练,研究人员可基于动作、状态、视觉的同步数据,训练机器人复刻人类操作逻辑,完成复杂双手协作任务;可用于双手机器人运动控制算法的验证优化,对比不同控制策略下的关节运动精度、轨迹拟合效果;也可用于多模态具身智能感知算法研发,探索视觉观测与关节运动状态的映射关系,提升机器人在非结构化场景下的自主决策能力;还可作为行业基准测试数据集,支撑不同研发团队的算法效果横向对比,助力具身智能领域评估标准的统一。
当前数据要素已成为人工智能产业发展的核心生产资料,开源数据集更是降低研发门槛、推动技术普惠的重要公共基础设施。本次0512_setting_2nd数据集的发布,进一步丰富了双手机器人领域的开源数据供给,对于高校科研团队、中小创业团队开展具身智能相关研究具有重要支撑价值,也为后续双手机器人场景的商业化落地积累了标准化数据资产。





_1769672084863.jpg)