随着具身智能产业进入落地攻坚期,真实物理场景下的多模态同步标注数据集,已成为制约服务机器人操作精度、环境感知能力提升的核心瓶颈之一。针对餐饮服务等高频落地场景的专用训练数据缺口,机器人技术厂商nodogoro近日正式对外发布cell2_20260516_mm_coffee_prep_20260516_222000专用机器人数据集,该数据集于2026年5月17日率先登陆HuggingFace平台,主要面向机器人控制与操作、多模态机器人感知两大核心研发方向。
据介绍,本次发布的数据集采用行业通用的LeRobot工具创建,专门面向机器人学习和控制任务设计,完整记录了单次咖啡制备全流程任务(episode)的所有运行数据,共包含328帧采集内容,采集帧率为30fps,采用便于机器学习框架直接读取的parquet文件格式存储,数据文件总大小为100MB,配套视频文件总大小为200MB,适配机器人型号为starpilot_yam_gripper。
该数据集实现了执行端、感知端、元数据的全维度同步采集,核心特征覆盖四大类:一是动作数据(action),包含两个机械臂的14维控制参数,覆盖位置、旋转角度、夹爪宽度等核心执行指令;二是观测状态数据(observation.state),包含两个机械臂的32维传感器信息,覆盖编码器角度、IMU加速度与陀螺仪数据、姿态坐标与四元数、夹爪实时状态等本体传感数据;三是图像数据(observation.images),来自多摄像头采集阵列,包含左腕0号、右腕0号摄像头的RGB图像与深度图像,以及基座0号、1号摄像头的RGB图像,所有图像分辨率覆盖480x640、768x1024两档,采用h264编码的视频格式存储;四是配套元数据,包含时间戳、帧索引、episode索引、任务索引等标注信息,可满足不同研发场景的标注需求。
作为聚焦咖啡制备场景的专用机器人数据集,该产品可广泛应用于多个研发方向:在机器人控制领域,可用于训练双臂服务机器人的精细动作模型,支撑咖啡接取、物料摆放、杯具转移等高频操作的控制算法迭代;在多模态感知领域,可用于研发机器人在动态餐饮场景下的环境识别、障碍物规避、操作状态实时判断等感知能力;在强化学习领域,可作为仿真环境到真实场景迁移(Sim2Real)的基准测试数据集,降低具身智能算法的落地验证成本。本次数据集的发布,也将进一步丰富服务机器人场景的训练数据供给,为餐饮、零售等场景的服务机器人商业化落地提供底层数据支撑。
查看cell2_20260516_mm_coffee_prep_20260516_222000





_1769672084863.jpg)