当前全球机器人产业正处于从专用场景向通用场景迭代的关键阶段,多模态大模型与实体机器人的融合成为主流技术路线,但实机操作场景下的高质量标注数据集稀缺,是制约机器人控制、视觉感知算法精度提升的核心痛点之一。近日,机器人技术研发方nodogoro正式对外发布双机械臂颜色分拣专用操作数据集,该数据集于2026年5月22日率先在全球最大的AI开源社区HuggingFace上线,面向全行业开放使用。
本次发布的数据集cell1_20260519_mohammed_loge-color-sorting_20260519_180136,是基于LeRobot工具链创建的机器人操作专用数据集。LeRobot作为HuggingFace推出的机器人领域开源工具,广泛被全球研究者用于机器人数据集的标准化采集、标注与发布,保障了本次数据集的格式兼容性与标注规范性,可直接适配主流机器人算法训练框架。
该数据集专门针对机器人技术研发任务设计,包含6个完整的颜色分拣操作情节,总计2888帧采集数据,采集帧率为30帧/秒,结构化数据文件总大小为100MB,配套视频文件大小为200MB,采用商用友好的Apache 2.0开源许可证,使用者可自由修改、分发甚至用于商业产品研发。本次数据集的采集载体为starpilot_yam_gripper双机械臂平台,支持双机械臂协同操作场景的算法训练。数据集的标注维度覆盖三类核心数据:一是14维的动作数据,包含机械臂空间位置、旋转角度、夹爪开合宽度等核心控制参数;二是32维的观测状态数据,包含机械臂编码器角度、IMU运动传感数据、夹爪实时状态等本体传感信息;三是多视角视觉观测数据,分别来自左腕、右腕、基座三个位置的摄像头,分辨率覆盖480x640到768x1024,采用通用RGB格式存储。结构化数据采用大数据领域通用的parquet格式存储,视频文件为标准MP4格式,目前公开版本仅包含训练分割数据集。
作为面向颜色分拣场景的专用数据集,其可广泛应用于多个机器人研发领域:在工业自动化场景中,可用于电子元器件、农产品、快消品等品类的颜色分拣工位机器人算法训练,降低企业实采数据的时间与成本;在双机械臂协同控制研发领域,可用于多臂路径规划、协同作业、力控适配等算法的训练与基准测试;在多模态感知领域,其多视角视觉+本体传感的多维度数据,可支持视觉-传感融合感知模型的训练,提升机械臂在复杂光照、遮挡场景下的操作精度。
当前我国数据要素市场建设持续推进,产业级AI数据集作为人工智能与实体产业融合的核心基础设施,其供给能力直接决定了细分行业的数字化转型进度。本次nodogoro发布的细分场景专用数据集,进一步丰富了国内机器人操作数据集的供给池,其商用友好的开源协议也将为中小研发团队降低技术门槛,推动机器人操作控制、视觉感知技术的落地普及。
查看cell1_20260519_mohammed_loge-color-sorting_20260519_180136





_1769672084863.jpg)