近年来随着具身智能、工业自动化赛道的快速发展,机器人控制模型的训练对高质量、多模态的场景数据集需求持续攀升,但目前行业内面向机械臂操作、动态抓取等细分场景的标注数据集供给相对不足,多维度数据匹配度低、场景覆盖窄等问题普遍存在,成为制约相关技术落地的核心瓶颈之一。
近期,专业机器人技术服务商nodogoro正式发布cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_003414机器人学习数据集,该数据集于2026年5月17日首发于全球知名AI开源社区HuggingFace,专门面向机器人控制、机械臂操作领域的研发需求打造。
据介绍,该数据集采用LeRobot工具创建,基于starpilot_yam_gripper类型机器人的实际操作场景采集生成,共包含2个完整操作episodes、7240帧采集数据,采样帧率为30fps。数据维度覆盖三大类核心特征:一是机器人动作数据,包括机械臂空间位置、抓取器开合宽度等操作参数;二是本体状态观测数据,包括机器人编码器角度、IMU惯性测量数据、机身姿态等传感器输出;三是多视角视觉数据,同步收录了左右手腕摄像头、基座摄像头采集的RGB图像与深度图像视频,实现了操作动作、本体状态、环境感知三类数据的时间戳精准对齐。存储层面,结构化数据采用高压缩率、高读取效率的Parquet文件格式存储,视频文件则采用通用MP4格式,可直接适配PyTorch、TensorFlow等主流深度学习框架的训练需求,无需额外做格式转换处理。
从应用方向来看,该数据集可广泛用于多个机器人研发场景:包括工业生产场景下机械臂分拣、精密装配的控制模型预训练,具身智能服务机器人的动态抓取策略优化,人机协作场景下的机器人动作安全校验,以及机器人仿真模型的虚实一致性验证等,可有效降低相关研发团队的原始数据采集成本,缩短模型迭代周期。作为面向机器人垂直领域的专用数据集,本次发布的产品进一步丰富了全球AI开源社区的机器人训练数据供给,对于推动机器人控制技术的商业化落地、加快数据要素在人工智能实体化应用领域的价值释放具有积极作用。
查看cell1_20260516_youssef-mohamed_9pm-12pm_lego20260517_003414





_1769672084863.jpg)