近年来,随着人形机器人、工业协作机器人赛道商业化进程加快,机器人物体抓取、视觉伺服控制技术的落地需求持续增长,但细分操作场景下的结构化标注训练数据集供给不足,始终是制约中小研发团队技术迭代的核心痛点之一。近日,AI数据集贡献者sailingsan正式上线pick_green_cube_20260515_172438专用机器人操作数据集,为相关领域研发提供高质量的基础数据支撑。
该数据集基于HuggingFace开源机器人学习框架LeRobot创建,是聚焦于绿色立方体抓取任务的垂直专用数据集,采集载体为so_follower型机器人,全量数据集包含10个采集序列、共6016帧有效数据,采集帧率为30fps。在数据维度上,该数据集同步覆盖多模态标注内容:动作层包含肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置在内的6维关节位置数据;观测层包含与动作维度对应的6维关节状态数据,以及分辨率为480x640的前视摄像头视频流(采用AV1编解码,无音频通道),同时配套时间戳、帧索引、集索引、任务索引等结构化标注字段,方便研发人员直接调用拆分。
在存储格式上,该数据集分别提供结构化parquet文件与原始视频文件两类下载渠道,其中parquet文件总大小为100MB,原始视频文件总大小为200MB,按1000帧为单位进行分块存储,全量数据集均归入训练集,覆盖所有10个采集序列,可直接对接主流机器人学习训练框架,无需额外预处理即可投入模型训练。
从应用价值来看,该数据集可广泛应用于多个机器人研发场景:比如工业分拣场景下指定颜色物料的抓取算法训练、协作机器人的视觉伺服控制模型调优、机器人强化学习的预训练环境搭建、轻量型边缘端机器人操作模型的性能验证等。作为数据要素市场中垂直领域的专用训练数据,这类聚焦细分任务、标注维度完整的开放数据集,能够有效降低机器人研发团队的前期数据采集成本,缩短算法迭代周期,对于推动机器人操作技术从实验室走向落地场景具有重要的支撑作用。
查看pick_green_cube_20260515_172438





_1769672084863.jpg)