近年来具身智能产业进入爆发期,服务类机器人在餐饮、零售等消费场景的落地需求持续攀升,但真实服务场景下的高标注多模态训练数据短缺,已经成为制约机器人感知、控制算法迭代,以及模仿学习技术落地的核心瓶颈之一。作为开源机器人数据集领域的重要参与方,nodogoro本次发布的全新细分场景数据集,就为行业填补了餐饮服务场景的专用数据供给空白。
2026年5月22日,该数据集正式首发上线HuggingFace平台。据公开信息显示,该数据集由专注机器人学领域的LeRobot创建,共包含8个任务序列(episodes),总计3179帧有效数据,覆盖1项完整的咖啡馆场景操作任务,采用parquet格式存储并配套原始视频文件,方便开发者直接调用开展模型训练。
从数据维度来看,该数据集的标注内容覆盖三大类核心特征:一是14维浮点数组构成的动作数据,完整记录两个机械臂的位置、旋转角度和夹爪宽度等操作参数;二是32维浮点数组构成的观测状态数据,涵盖编码器角度、IMU加速度与陀螺仪数据、姿态四元数、夹爪实时状态等机器人本体运行参数;三是多视角视觉采集数据,包括左腕0号摄像头的480x640分辨率RGB图像与深度图像、右腕0号摄像头同规格RGB与深度图像、基座0号摄像头480x640分辨率RGB图像,以及基座1号摄像头768x1024分辨率RGB图像,所有视频内容均以30fps帧率录制,采用h264编解码器,完整还原真实咖啡馆场景下的操作环境与视觉信息。
作为聚焦咖啡馆实体场景的专用机器人数据集,该产品的典型应用方向覆盖三大领域:首先是双机械臂服务机器人的操作控制算法训练,开发者可基于标注的动作数据优化咖啡制作、物品递送等场景下的机械臂协同精度;其次是视觉感知模型迭代,多视角、带深度信息的图像数据可支撑复杂餐饮场景下的物品识别、环境感知、动态避障等算法训练;第三是模仿学习技术落地,完整的任务序列数据可直接用于机器人端到端的操作行为模仿训练,大幅降低真实场景下的算法冷启动成本。该数据集的发布,也进一步丰富了具身智能领域的真实场景数据供给,对推动服务机器人在消费场景的规模化落地、完善AI训练数据要素市场的细分品类供给都具有积极意义。
查看cell2_20260522_mohamed_coffee_shop_setting20260522_000819





_1769672084863.jpg)