当前通用机器人产业正处于技术落地的关键窗口期,模仿学习、强化学习作为机器人自主决策的核心技术路径,长期面临高质量真实场景训练数据不足的痛点——尤其是针对不规则物体操作、分布外(OOD,即与训练集分布不一致的真实场景)的专用数据集供给缺口明显,成为制约算法泛化能力提升、阻碍机器人落地复杂真实场景的核心瓶颈之一。在此背景下,专注机器人核心技术研发的Frobotics正式推出banana_bowl_OOD_banana_position专用数据集,面向机器人操作控制、模仿学习等领域的研发需求提供支撑。
该数据集由机器人领域专用数据工具LeRobot创建,针对机械臂桌面操作场景设计,总共包含9个完整任务片段,累计2601帧有效标注数据,覆盖3类不同的操作任务,数据采集采用的机器人型号为so_follower。存储层面,结构化的关节、状态数据采用parquet格式存储,方便研究人员快速读取、筛选与标注;视觉观测数据采用mp4格式存储,帧率为30fps,完全满足时序模型的训练精度要求。
本次发布的数据集包含多维度的全链路标注信息,可支撑多模态机器人技术研究:首先是动作特征,覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置共6个核心关节的位置数据,对应机械臂完成抓取、移动、放置动作的全量自由度参数;其次是观察状态特征,同步记录了机器人自身传感器采集到的与动作维度一致的6个关节实时位置,可用于对比动作指令与实际执行偏差的相关研究;此外还包含camera1采集的分辨率为720x1280的3通道RGB视频数据,以及时间戳、帧索引、片段索引、任务索引等全量元数据,方便研究人员完成时序对齐、任务拆分、多模态数据匹配等操作。
从应用价值来看,该数据集作为面向OOD场景的专用操作数据集,可支撑多个方向的机器人技术研究:其一可用于服务机器人桌面操作算法训练,针对香蕉这类形状不规则、易变形的日常物品的抓取、放置任务,为家庭服务机器人、餐饮服务机器人的物品操作功能提供训练数据支撑;其二可用于模仿学习算法的鲁棒性验证,依托OOD场景的数据特性,测试算法在训练场景之外的泛化能力,降低算法在真实环境下的失效风险;其三可用于强化学习的示范轨迹参考,为稀疏奖励场景下的强化学习模型提供标准操作路径,降低训练成本,提升训练效率。在数据要素成为AI与机器人产业核心生产资料的当下,该数据集的发布进一步丰富了真实物理场景下的机器人操作数据供给,为中小研发团队、学术机构降低数据采集成本,推动通用机器人操作技术的落地迭代提供了重要的公共支撑。
查看banana_bowl_OOD_banana_position





_1769672084863.jpg)