随着具身智能产业进入商业化落地关键期,高保真、场景化的多模态操作数据集已成为支撑机器人算法研发的核心刚需——尤其是面向餐饮、零售等民生服务场景的双臂机器人训练数据,长期存在采集成本高、标注维度不全、场景匹配度低的行业痛点。近日,机器人技术厂商nodogoro正式发布适配starpilot_yam_gripper双臂机器人的咖啡店场景操作数据集,于2026年5月22日首发上线HuggingFace,面向全球研发人员开放使用。
本次发布的cell2_20260521_mohamed_coffee_shop_setting20260521_235624数据集,基于LeRobot开源机器人训练平台构建,是专门针对服务场景双臂操作任务打造的高质量数据集。数据集完整覆盖8组咖啡店场景下的机器人全流程操作片段(episodes),累计录制2297帧时序数据,采样速率达30fps,完整还原了真实服务场景下机器人操作的连贯性与动态特征。
从数据维度来看,该数据集的多模态特征覆盖了机器人操作训练的全链路需求:14维动作数据完整记录了两个机械臂的x/y/z空间位置、旋转角度与抓取宽度参数,可直接作为强化学习训练的动作标注输入;32维观察状态数据包含机械臂编码器角度、IMU加速度与陀螺仪数据、姿态位置与四元数、抓取器实时状态等本体传感信息,为机器人控制算法研发提供了精准的本体状态参考;多摄像头视觉数据则同步收录了左腕、右腕、基座三个视角的RGB图像与深度图像,分别匹配480x640、768x1024两种分辨率,既可以通过全局视角摄像头捕捉场景动态,也可以通过腕部近景摄像头满足咖啡拉花、杯具抓取等精细操作的训练需求。
数据集采用高效的parquet格式存储结构化数据,配合mp4格式的原始视频文件,可大幅降低研发人员的数据加载与预处理成本。同时该数据集遵循Apache 2.0开源许可证,支持学术研究与商业开发场景的免费使用,进一步降低了行业研发门槛。
从应用方向来看,该数据集可广泛应用于机器人操作学习、视觉伺服控制等核心领域:研发人员可基于该数据集训练服务机器人的咖啡制作、餐品递送、桌面整理等咖啡店高频操作技能,减少真实场景下的试错成本;也可用于验证多模态融合的视觉伺服控制算法,提升双臂机器人在动态场景下的协同操作精度、避障能力与精细操作稳定性;相关技术还可复用至奶茶店、快餐店、家庭服务等同类餐饮操作场景,加速服务机器人的通用化落地。
作为数据要素市场的重要组成部分,具身智能场景数据集的供给能力直接决定了产业的发展速度。本次nodogoro发布的咖啡店场景专用数据集,填补了服务机器人细分场景高质量训练数据的供给空白,对于推动具身智能算法研发、降低商业化落地成本具有重要的行业价值。
查看cell2_20260521_mohamed_coffee_shop_setting20260521_235624





_1769672084863.jpg)