当下具身智能产业进入快速落地期,机械臂作为工业自动化、服务机器人领域的核心执行单元,其抓取精度、响应速度、环境适应性的提升高度依赖多模态训练数据的支撑,但当前公开市场中面向特定抓取任务、同时包含关节状态、多视角视觉、操作干预信号的高质量标注数据集供给相对稀缺,成为中小研发团队降低算法训练门槛的核心痛点。在此背景下,数据提供方nirs123于2026年5月24日在HuggingFace平台首发rollout_pick_blue_cube专用数据集,面向机械臂物体抓取、机器人视觉控制两大核心场景提供训练支撑。
本次发布的rollout_pick_blue_cube数据集采用LeRobot工具创建,该工具是HuggingFace推出的面向机器人学习领域的开源工具链,可实现机器人操作数据的标准化采集、标注与分享,目前已成为全球机器人研发团队的主流数据生产工具之一。该数据集主要用于机器人学任务,具体涉及机械臂操作(如拾取蓝色立方体)。数据集包含以下特征:动作(6个浮点值,对应机械臂关节位置)、观测状态(6个浮点值,同样表示关节位置)、观测图像(包括腕部摄像头和顶部摄像头的视频,分辨率分别为640x480和480x640,30fps,编码为av1)、干预信号(布尔值)、时间戳、帧索引、回合索引、索引和任务索引。数据集总共有1个回合、9143帧、1个任务,数据以parquet文件格式存储,视频以mp4格式存储。机器人类型为so_follower,采样频率为30fps。数据文件总大小为100MB,视频文件总大小为200MB。
从应用场景来看,该类面向细分机械臂操作任务的多模态数据集,可支撑多类研发需求:一是具身智能大模型的小样本微调,研发人员可基于该数据集验证机械臂在结构化场景下的目标识别-路径规划-抓取执行全链路算法;二是机器人视觉伺服控制算法的迭代,多视角摄像头与关节状态的同步采集数据,可支撑视觉信号与机械运动参数的匹配训练,提升低光照、遮挡等复杂场景下的抓取成功率;三是可用于工业拣选场景的预演验证、机器人教学实训的案例支撑等方向,有效降低相关研发团队的原始数据采集成本。
作为面向垂直场景的公开数据集,本次rollout_pick_blue_cube的发布也是数据要素向具身智能产业流通的典型实践,标准化细分数据集的开放共享,有助于缩短机器人相关算法的落地周期,推动产业普惠化发展。





_1769672084863.jpg)