当前,全球人形机器人、工业协作机器人赛道正处于高速发展期,机器学习模型训练对真实场景下的多模态、高标注质量机器人操作数据集需求持续攀升,但公开领域中同时覆盖机械臂本体状态、动作数据、同步视觉信息的一体化数据集供给仍存在明显缺口,成为制约中小科研团队、初创企业开展机器人技术研发的核心门槛之一。
近日,科研主体sonya-1-23正式发布PickBottle2机器人操作专项数据集,该数据集已于2026年4月29日首发于全球知名AI开源社区HuggingFace,面向全球研发人员开放使用。
据公开信息显示,本次发布的PickBottle2数据集基于业内常用的机器人学习开源工具LeRobot创建,可实现多模态数据的天然时间对齐,无需额外预处理即可直接用于模型训练。该数据集针对panda_ros_cartesian型机械臂的操作场景采集,整体包含15个完整操作片段,共7446帧同步数据,数据集文件总大小为100MB,配套原始视频文件大小为200MB。数据维度覆盖四大类核心信息:一是7维动作速度信息,完整记录机械臂操作过程中的动作参数;二是8维关节位置观察状态,可还原机械臂每一个关节的实时运行状态;三是两路分辨率为480x640、帧率30fps的摄像头同步采集图像,可支撑视觉相关算法的训练;四是配套完整的时间戳、帧索引等元数据,可满足不同研发场景的数据调用需求。
从应用价值来看,PickBottle2数据集的多模态同步特性可广泛应用于多个机器人研发场景:在机器人控制领域,研发人员可基于标注的动作、关节状态数据训练机械臂的轨迹规划、精细力控模型,提升机器人在抓取、分拣、搬运等操作场景下的稳定性与精度,可支撑工业产线自动化、物流拆垛分拣等场景的机器人技术研发;在视觉感知领域,两路同步的视觉数据搭配对应的机械臂操作状态,可用于视觉伺服、动态目标识别、3D视觉定位等算法的训练与验证,帮助机器人实现无标定场景下的自主操作;此外,该数据集还可作为多模态机器人学习模型的标准化基准测试集,用于对比不同算法在真实机械臂操作场景下的性能表现,大幅降低研发团队的实机数据采集成本。
此次PickBottle2数据集的开源发布,进一步丰富了全球公开机器人学习数据集的供给,对于推动协作机器人操作技术的普惠化发展、加速机器人领域的技术迭代有着积极作用,也为数据要素在人工智能研发场景的价值落地提供了典型样本。
sonya-1-23本次发布的数据集PickBottle2,该数据集使用LeRobot创建,主要包含机器人操作相关的数据。数据集结构包括15个片段,7446帧,1个任务,数据文件大小为100MB,视频文件大小为200MB。特征包括动作(7维速度信息)、观察状态(8维关节位置信息)、两个摄像头图像(480x640分辨率,30fps)以及时间戳、帧索引等元数据。机器人类型为panda_ros_cartesian。





_1769672084863.jpg)