five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

nodogoro首发咖啡制备场景多模态机器人数据集 赋能具身智能控制与感知研发

五号数据雷达开源数据市场2026-05-17 23:298
机器人技术厂商nodogoro于2026年5月17日在HuggingFace平台首发咖啡制备场景多模态机器人数据集,覆盖机械臂控制参数、多视角视觉、本体传感等多维度同步标注数据,将为机器人控制、多模态感知、强化学习等领域研发提供标准化训练支撑。

随着具身智能产业进入落地攻坚期,真实物理场景下的多模态同步标注数据集,已成为制约服务机器人操作精度、环境感知能力提升的核心瓶颈之一。针对餐饮服务等高频落地场景的专用训练数据缺口,机器人技术厂商nodogoro近日正式对外发布cell2_20260516_mm_coffee_prep_20260516_222000专用机器人数据集,该数据集于2026年5月17日率先登陆HuggingFace平台,主要面向机器人控制与操作、多模态机器人感知两大核心研发方向。

据介绍,本次发布的数据集采用行业通用的LeRobot工具创建,专门面向机器人学习和控制任务设计,完整记录了单次咖啡制备全流程任务(episode)的所有运行数据,共包含328帧采集内容,采集帧率为30fps,采用便于机器学习框架直接读取的parquet文件格式存储,数据文件总大小为100MB,配套视频文件总大小为200MB,适配机器人型号为starpilot_yam_gripper。

该数据集实现了执行端、感知端、元数据的全维度同步采集,核心特征覆盖四大类:一是动作数据(action),包含两个机械臂的14维控制参数,覆盖位置、旋转角度、夹爪宽度等核心执行指令;二是观测状态数据(observation.state),包含两个机械臂的32维传感器信息,覆盖编码器角度、IMU加速度与陀螺仪数据、姿态坐标与四元数、夹爪实时状态等本体传感数据;三是图像数据(observation.images),来自多摄像头采集阵列,包含左腕0号、右腕0号摄像头的RGB图像与深度图像,以及基座0号、1号摄像头的RGB图像,所有图像分辨率覆盖480x640、768x1024两档,采用h264编码的视频格式存储;四是配套元数据,包含时间戳、帧索引、episode索引、任务索引等标注信息,可满足不同研发场景的标注需求。

作为聚焦咖啡制备场景的专用机器人数据集,该产品可广泛应用于多个研发方向:在机器人控制领域,可用于训练双臂服务机器人的精细动作模型,支撑咖啡接取、物料摆放、杯具转移等高频操作的控制算法迭代;在多模态感知领域,可用于研发机器人在动态餐饮场景下的环境识别、障碍物规避、操作状态实时判断等感知能力;在强化学习领域,可作为仿真环境到真实场景迁移(Sim2Real)的基准测试数据集,降低具身智能算法的落地验证成本。本次数据集的发布,也将进一步丰富服务机器人场景的训练数据供给,为餐饮、零售等场景的服务机器人商业化落地提供底层数据支撑。

查看cell2_20260516_mm_coffee_prep_20260516_222000

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们