首页 / 开源数据市场 / 正文

nodogoro首发咖啡制备场景多模态机器人数据集赋能具身智能控制与感知研发

五号数据雷达开源数据市场2026-05-17 23:298

机器人技术厂商nodogoro于2026年5月17日在HuggingFace平台首发咖啡制备场景多模态机器人数据集，覆盖机械臂控制参数、多视角视觉、本体传感等多维度同步标注数据，将为机器人控制、多模态感知、强化学习等领域研发提供标准化训练支撑。

随着具身智能产业进入落地攻坚期，真实物理场景下的多模态同步标注数据集，已成为制约服务机器人操作精度、环境感知能力提升的核心瓶颈之一。针对餐饮服务等高频落地场景的专用训练数据缺口，机器人技术厂商nodogoro近日正式对外发布cell2_20260516_mm_coffee_prep_20260516_222000专用机器人数据集，该数据集于2026年5月17日率先登陆HuggingFace平台，主要面向机器人控制与操作、多模态机器人感知两大核心研发方向。

据介绍，本次发布的数据集采用行业通用的LeRobot工具创建，专门面向机器人学习和控制任务设计，完整记录了单次咖啡制备全流程任务（episode）的所有运行数据，共包含328帧采集内容，采集帧率为30fps，采用便于机器学习框架直接读取的parquet文件格式存储，数据文件总大小为100MB，配套视频文件总大小为200MB，适配机器人型号为starpilot_yam_gripper。

该数据集实现了执行端、感知端、元数据的全维度同步采集，核心特征覆盖四大类：一是动作数据（action），包含两个机械臂的14维控制参数，覆盖位置、旋转角度、夹爪宽度等核心执行指令；二是观测状态数据（observation.state），包含两个机械臂的32维传感器信息，覆盖编码器角度、IMU加速度与陀螺仪数据、姿态坐标与四元数、夹爪实时状态等本体传感数据；三是图像数据（observation.images），来自多摄像头采集阵列，包含左腕0号、右腕0号摄像头的RGB图像与深度图像，以及基座0号、1号摄像头的RGB图像，所有图像分辨率覆盖480x640、768x1024两档，采用h264编码的视频格式存储；四是配套元数据，包含时间戳、帧索引、episode索引、任务索引等标注信息，可满足不同研发场景的标注需求。

作为聚焦咖啡制备场景的专用机器人数据集，该产品可广泛应用于多个研发方向：在机器人控制领域，可用于训练双臂服务机器人的精细动作模型，支撑咖啡接取、物料摆放、杯具转移等高频操作的控制算法迭代；在多模态感知领域，可用于研发机器人在动态餐饮场景下的环境识别、障碍物规避、操作状态实时判断等感知能力；在强化学习领域，可作为仿真环境到真实场景迁移（Sim2Real）的基准测试数据集，降低具身智能算法的落地验证成本。本次数据集的发布，也将进一步丰富服务机器人场景的训练数据供给，为餐饮、零售等场景的服务机器人商业化落地提供底层数据支撑。

查看cell2_20260516_mm_coffee_prep_20260516_222000

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

nodogoro首发咖啡制备场景多模态机器人数据集 赋能具身智能控制与感知研发

Dataset card内容：

Files and versions内容：

社区讨论

nodogoro首发咖啡制备场景多模态机器人数据集赋能具身智能控制与感知研发