随着通用服务机器人商业化进程加速,餐饮、家用场景下的精细化操作能力成为行业技术攻坚的核心方向,而真实物理场景下的多模态标注训练数据,是支撑机器人动作模型迭代、感知能力升级的核心底座,长期以来存在采集成本高、场景覆盖不全、数据维度单一等行业痛点。
近日,机器人技术厂商nodogoro正式发布cell2_20260516_mm_coffee_prep_20260517_000248数据集,该数据集是面向咖啡制备操作场景的专用机器人任务数据集,采用HuggingFace旗下开源机器人学习工具栈LeRobot创建,于2026年5月17日首发于HuggingFace平台,主要面向机器人操作技能学习、多模态机器人感知两大研发方向开放使用。
据介绍,该数据集采集自starpilot_yam_gripper型号双机械臂的咖啡制备全流程操作,共包含7组完整操作序列(episodes)、6000帧采样数据,采样帧率为30fps。数据维度覆盖三大类核心信息:一是动作特征数据,包含机械臂的空间位置、旋转角度、夹爪开合宽度等全量操作参数;二是设备状态观测数据,包含机械臂编码器角度、IMU传感器采集的加速度与陀螺仪数据、实时位姿数据及夹爪运行状态数据;三是多视角视觉观测数据,包含左腕、右腕、基座三个位置摄像头采集的图像与深度视频数据,分辨率分别为480x640和768x1024,可还原操作场景下的全视角环境信息。存储方面,结构化数据采用parquet格式存储,文件大小为100MB,视频数据采用MP4格式存储,文件大小为200MB,所有数据均划分至训练集供研发使用。
从应用价值来看,该数据集瞄准餐饮服务机器人的高频刚需场景,可支撑多个方向的技术研发:在操作技能学习方向,研发团队可基于标注的动作序列数据训练双机械臂的精细操作能力,覆盖磨豆、萃取、打奶泡、拉花等咖啡制备全流程动作,降低真实场景下的试错成本;在多模态感知方向,可结合视觉、传感、动作数据训练机器人的环境识别能力,实现对物料状态、操作风险、用户需求的实时判断;此外,基于LeRobot通用格式存储的特性,该数据集还可支撑跨品牌、跨型号机械臂的技能迁移研究,助力通用机器人操作模型的快速迭代。
业内分析指出,当前数据要素已经成为AI与机器人产业发展的核心生产要素,场景化、多模态、高质量的标注数据集的开放共享,可有效降低行业研发门槛,加快服务机器人在餐饮、家用等场景的商业化落地速度。
查看cell2_20260516_mm_coffee_prep_20260517_000248





_1769672084863.jpg)