近年来,家用服务机器人、人机协同系统的商业化落地进程加速,而细分场景下的多模态标注数据集,一直是制约机器人动作控制、环境感知算法迭代的核心瓶颈之一。相较于通用场景数据集,面向特定操作场景、同时覆盖机器人运动参数、传感器状态、多视角视觉信息的专业数据集供给缺口显著,是学界、产业界共同关注的核心研发资源。
近日,开发者fecasado正式在HuggingFace平台首发机器人学专用数据集blueberry-kitchen-merged,首发时间为2026年5月3日,主要面向机器人动作控制、多视角视觉感知两大研发场景开放使用。
fecasado本次发布的blueberry-kitchen-merged是典型的家用厨房场景机器人操作数据集,包含120个实验序列(episodes)和56763帧多模态数据,覆盖2类核心厨房操作任务。数据集完整记录了三类核心数据维度:一是机器人的全链路动作数据,包括左右手臂和手部的线性、角度运动参数;二是机器人的实时观察状态数据,包括关节位置和力矩、自身视线信息等传感器反馈数据;三是多视角同步图像数据,覆盖机器人左、右视角,用户视角及用户视线视角共四个维度。存储层面,结构化数据以parquet格式存储,视频素材以mp4格式存储,采样帧率为15fps,适配主流算法训练的帧率要求。本次公开的数据集所适配的机器人型号为blueberry_ros,总大小为300MB,其中结构化数据文件100MB,视频文件200MB,轻量化的存储设计也降低了中小研发团队的下载和使用门槛。
从落地应用价值来看,该数据集可广泛覆盖多个机器人研发场景:在机器人动作控制领域,研究人员可基于标注的完整动作序列,训练家用服务机器人的厨房操作动作模型,优化餐具抓取、食材整理等高频操作的运动路径,减少冗余动作,提升操作精度与运行效率;在多视角视觉感知领域,四类视角的同步采集数据可支撑多模态感知模型的训练,帮助机器人更好地识别厨房复杂环境下的障碍物、预判用户操作意图,优化人机交互过程中的响应逻辑,此外也可用于多视角数据融合、3D环境建模等相关技术的验证迭代。
作为数据要素在AI机器人领域的典型落地载体,本次公开的专业数据集进一步丰富了家用场景机器人研发的数据集供给,为学界的前沿研究、产业界的算法迭代提供了高质量的基础数据支撑,对推动服务机器人在家庭场景的商业化落地具有积极作用。





_1769672084863.jpg)