近年来,具身智能赛道进入商用落地攻坚期,家庭服务机器人作为直面C端需求的核心品类,用户对其承担家务操作、提升生活便利性的期待持续攀升。但相较于工业场景的结构化环境,家庭场景存在空间布局差异化高、操作对象形态多样、任务链路碎片化等特点,聚焦细分家庭操作场景的高质量标注训练数据稀缺,已成为制约家庭服务机器人泛化能力提升、商业化落地的核心瓶颈之一。
在此背景下,开发者AnranZZ于2026年5月15日在全球知名AI资源共享平台HuggingFace首发了open_the_ricecooker_and_put_food_inside专项机器人数据集,专门针对Stretch移动操作机器人设计,依托LeRobot工具完成全流程数据采集与标注,是国内为数不多的聚焦家庭厨房细分操作场景的公开具身数据集。
本次发布的数据集共包含32组完整操作序列、10000帧标注数据,仅开放训练集,覆盖索引0到32;结构化数据以parquet文件格式存储,总大小为100MB,配套视频文件大小为200MB,采集帧率为15fps。数据集标注维度覆盖机器人操作全链路核心参数,数据特征十分丰富:既包含机器人核心运行状态数据,如观察状态(末端执行器姿态、夹爪开合度等)、动作指令(目标末端执行器姿态、夹爪开合目标值等)、操作成功标志;也包含完整的感知传感数据,如相机空间姿态与内参、多视角图像数据(夹爪相机视频分辨率为240x320、头部相机视频分辨率为320x240,采用高压缩率的AV1编解码器存储);同时配套了时间戳、帧索引、序列索引等元数据,多维度还原“打开电饭煲、放入食物”完整操作的全流程信息。
作为场景化的机器人专用训练数据集,其可广泛应用于多个具身智能研发方向:首先可直接支撑家庭服务机器人的厨房操作任务训练,除电饭煲操作外,还可泛化到微波炉、烤箱、储物柜等带开合结构的家电、家具操作任务研发,降低细分场景的研发成本;其次可用于多模态融合的运动控制模型训练,结合视觉数据与姿态控制数据,可训练视觉引导的高精度机械臂控制算法,提升机器人在非结构化家庭场景的操作稳定性;此外还可用于强化学习奖励函数、人机协作任务规划、操作意图理解等方向的研究,为家庭服务机器人的能力迭代提供核心数据支撑。
当前数据要素已成为AI产业发展的核心生产力,具身智能领域的公开场景化数据集更是稀缺资源,本次专项数据集的发布,填补了家庭厨房细分操作场景的公开数据空白,为中小研发团队、学术机构开展家庭服务机器人相关研究提供了可靠的数据支撑,也为国内具身智能领域的公开数据生态建设提供了参考。
查看open_the_ricecooker_and_put_food_inside





_1769672084863.jpg)