当前全球人形机器人、工业服务机器人产业正处于高速迭代期,模仿学习作为机器人快速习得复杂操作技能的核心技术路径,对场景化、高标注质量的专用训练数据存在迫切需求。多视角视觉与动作联动的数据集,更是解决机器人非结构化场景自主作业能力的核心基础资源。近日,科技厂商Jilloo正式对外发布lerobot_dataset_Sweet_110526数据集,该产品是基于LeRobot框架打造的专用机器人数据集,专为机器人任务优化设计,已于2026年5月11日率先在HuggingFace平台上线。
本次发布的数据集共包含55个训练episodes,总计47937帧采样数据,覆盖2类典型机器人操作任务,采样帧率为30fps。数据整体采用parquet结构化文件格式存储,结构化数据文件总大小为100MB,配套多视角视频文件总大小为500MB。该数据集针对性适配so101_follower型机器人,标注维度覆盖两类核心特征:其一为动作特征,包含肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕滚动、夹爪位置6类核心关节动作数据;其二为观测状态特征,同步标注对应时刻的机器人关节位置数据。此外,数据集配套提供三类视角的图像观测数据,分别为顶部全局视角、左手腕第一视角、右侧面侧视视角,单幅图像分辨率为480x640、3通道色彩模式,视频采用av1高压缩比编码,在保障画质的同时降低数据加载与传输成本。目前数据集仅开放训练分割子集(对应0:55 episodes),同步配套时间戳、帧索引、episode索引、全局索引、任务索引等完整元数据,方便研究人员快速匹配场景与标注信息。
查看lerobot_dataset_Sweet_110526
从应用价值来看,该数据集可广泛应用于多个机器人技术研发场景:在模仿学习领域,研究人员可依托标注完整的动作与观测联动数据,训练so101_follower机器人复现示教操作,降低实机试错的成本与安全风险,加速工业分拣、精密装配、服务辅助等场景的动作技能落地;在多视角视觉控制领域,三类视角的同步观测数据可用于训练机器人视觉感知与动作调整的联动算法,提升机器人在复杂遮挡、动态环境下的操作精度与环境适应性;此外,该数据集遵循LeRobot通用框架标准,也可作为基准测试数据集,用于不同机器人控制算法的性能横向对比,统一行业评估维度。
当前国内数据要素市场正加速向垂直细分领域渗透,AI训练数据尤其是机器人、自动驾驶等实体AI领域的专用数据,已成为产业创新的核心瓶颈资源。本次Jilloo发布的垂直领域专用数据集,进一步丰富了国内机器人训练数据的供给体系,对降低机器人算法研发门槛、加速通用机器人技术商业化落地具有积极意义。





_1769672084863.jpg)