当前全球服务机器人、人形机器人产业正处于商业化落地的关键期,与通用大模型不同,机器人操作类算法的训练高度依赖真实物理场景下的多模态交互数据,而双机械臂精细操作场景的数据采集成本高、标注难度大,一直是制约相关技术落地的核心瓶颈之一。近日,机器人技术厂商nodogoro正式对外发布cell1_20260523_mohammed_groceries_packing_20260523_215829机器人学数据集,该数据集于2026年5月24日率先在全球最大的开源AI社区HuggingFace上线,面向全球研发者开放。
据介绍,该数据集采用机器人学习领域主流的LeRobot开源框架构建,专门适配starpilot_yam_gripper类型双机械臂机器人,共包含5组完整操作序列(episodes)与3152帧同步采集的多维度数据。数据维度覆盖动作、观察两大核心模块:其中动作模块采用14维向量标注,可精准对应双机械臂的空间位置、旋转角度与夹爪开合宽度控制指令;观察模块则包含32维本体状态信息(含编码器角度、IMU加速度与陀螺仪数据、机械臂姿态、夹爪间距等),同时同步采集左腕、右腕、基座三个位置的摄像头数据,同时提供RGB彩色图像与深度感知数据,分辨率覆盖480x640、768x1024两种规格,采集帧率为30fps,完整还原了杂货装包场景下的全部环境与本体感知信息。数据集采用parquet结构化数据加原始视频的格式存储,可兼容主流机器人学习框架的快速调用。
从应用方向来看,该数据集可广泛应用于机器人操作控制算法研发、多模态机器人学习模型训练两大核心领域:一方面可用于训练商超自动分拣装袋机器人、家庭服务机器人物品整理功能、仓储物流拆零拣选机器人的精细操作能力,降低真实场景数据采集的时间与成本投入;另一方面也可为多模态融合算法研发提供真实场景的训练样本,支撑机器人实现视觉、力觉、本体状态的多源数据联动,提升复杂非结构化场景下的操作鲁棒性。
业内分析指出,随着数据要素市场建设的持续推进,垂直领域的高质量场景化数据已成为AI技术落地的核心生产资料,本次nodogoro开放的场景化机器人操作数据集,可有效降低中小研发团队的准入门槛,加快双机械臂操作类技术从实验室走向商用场景的落地节奏。
查看cell1_20260523_mohammed_groceries_packing_20260523_215829





_1769672084863.jpg)