近年来,随着人形机器人、工业协作机器人赛道的商业化进程加速,AI驱动的智能控制算法对真实场景下的多模态训练数据需求持续攀升,而具备同步动作标注、视觉采集、时序元数据的实操类数据集,始终是制约机器人控制技术落地的核心稀缺资源。2026年5月6日,Naomiihao正式对外发布机器人领域专用数据集banana_red_bowl,该数据集由LeRobot创建,本次首发上线于全球知名AI开源社区HuggingFace,面向全球研发人员开放使用。
据公开信息显示,本次发布的banana_red_bowl数据集共包含3个任务序列(episodes)、3552帧有效标注数据,对应1项典型机器人操作任务。数据集结构化内容采用标准化parquet格式存储,可直接接入主流AI训练框架,配套视觉内容采用mp4格式封装,大幅降低研发团队的数据预处理成本。数据集核心特征覆盖四大类,可满足机器人控制算法多维度训练需求:1) 动作信息:完整标注6个核心关节位置,涵盖肩部旋转、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置全运动链路参数;2) 观测状态:同步采集机器人侧的6个关节实时反馈位置,可用于控制算法的闭环效果验证;3) 前视图像:配套分辨率为480x640、帧率30fps的彩色视频流,参数匹配当前主流服务机器人、工业机械臂的前置视觉传感器配置,无需额外做分辨率适配即可投入训练;4) 时间戳、帧索引、episode索引等全链路元数据,可支撑时序类控制算法的训练与调试。
从行业应用来看,该数据集可广泛应用于机器人操作控制、视觉伺服系统两大核心研发领域。在机器人操作控制方向,研发人员可基于标注的关节动作序列,训练六自由度机械臂的抓取、放置类任务算法,优化日常物品、异形工件的抓取姿态,相关成果可落地于工业分拣、家庭服务、仓储物流等场景的机器人研发;在视觉伺服系统方向,同步对齐的视觉数据与关节位置数据,可支撑基于视觉反馈的闭环控制算法训练,帮助机器人实现无需预设运动路径、根据实时视觉输入动态调整关节姿态的能力,适配动态流水线作业、移动场景抓取、实时避障等复杂应用需求。作为机器人垂直领域的高质量开放数据集,banana_red_bowl的上线也为全球中小研发团队降低了训练数据获取门槛,对推动机器人控制算法的开源创新、加快数据要素在智能机器人赛道的落地应用具有积极意义。





_1769672084863.jpg)