近年来,随着具身智能赛道进入快速落地期,机器人控制算法迭代、视觉感知模型训练对场景化、高标注质量的专用数据集需求持续攀升,公开可复用的机器人实体交互类数据集已成为行业刚需。2026年5月6日,数据贡献方Naomiihao正式首发机器人领域专用数据集banana_blue_bowl_1,填补了日常物品交互场景下机器人训练数据的供给空白。
该数据集由LeRobot打造,面向机器人控制、视觉感知两大核心应用场景设计,包含5个episodes、2195帧数据,覆盖1项典型机器人操作任务。其数据结构包含动作(6个关节位置)、观察状态(6个关节位置)、前视图像(480x640x3)、时间戳、帧索引、episode索引等多维度特征,完整还原了机器人执行任务过程中的运动学参数与环境信息。数据集采用parquet格式存储结构化数据、mp4格式存储视频内容,帧率为30fps,可保障动作时序的连贯性,适配多模态算法的训练要求。此外,该数据集采用apache-2.0许可证,支持开发者进行非商用及商用二次开发,大幅降低了中小研发团队的算法研发门槛。
从潜在应用方向来看,banana_blue_bowl_1可广泛覆盖多个具身智能落地场景的研发需求:在家政服务机器人场景中,开发者可基于该数据集优化机器人的小物件抓取、日常物品识别能力,提升机器人完成取物、物品整理等日常任务的动作准确度;在工业分拣场景中,数据集可支撑多关节机械臂的运动路径规划算法迭代,优化小物件分拣的视觉识别精度;此外,该数据集还可用于具身智能大模型的微调训练、多机器人协同策略研发等方向,为机器人的通用交互能力迭代提供数据支撑。
Dataset card内容:
Files and versions内容:
作为机器人领域的垂直开源数据集,banana_blue_bowl_1的上线也进一步丰富了全球具身智能数据要素供给体系,为数据要素在AI实体化落地场景中的价值释放提供了新的样本,也为后续更多垂直场景机器人数据集的开源共享提供了参考范式。





_1769672084863.jpg)