当前,具身智能、工业协作机器人等赛道进入商业化落地关键期,高质量、多模态的机器人动作训练数据,是支撑机器人操作学习、控制算法迭代的核心生产要素,也是当前行业普遍面临的供给缺口环节。近日,xBerry正式发布lerobot_act多模态机器人学数据集,该数据集由LeRobot项目打造,于2026年5月15日首发于全球最大的AI模型与数据集社区HuggingFace,主要面向机器人操作学习、多模态机器人控制两大核心应用场景。
据介绍,lerobot_act数据集完整覆盖机器人动作执行、环境感知全链路数据,包含多维度标注内容:一是动作与观测状态数据,各包含6个对应关节位置的浮点值,覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置六大核心关节维度,可直接用于机器人控制算法的监督训练;二是多视角视觉数据,包含前视、侧视两路480*640分辨率3通道MP4格式视频,帧率为30fps,可支撑多模态感知与动作对齐算法研发;此外数据集还同步标注了时间戳、帧索引、任务索引、剧集索引、全局索引等元数据,方便研发人员按需调用、拆分训练集。该数据集整体采用Parquet文件格式存储,适配主流AI训练框架,适配的机器人类型为so_follower,可直接复用至同类六轴协作机器人的控制与学习任务研发。
从应用场景来看,lerobot_act数据集可广泛应用于多个机器人研发场景:在工业领域,可用于3C装配、物料搬运等场景的协作机器人动作规划算法训练,降低实机采集数据的高昂成本;在具身智能领域,可支撑多模态大模型与机器人动作控制的对齐研发,提升具身智能体的环境适配能力;在服务机器人领域,可用于家用、商用服务机器人的柔性操作训练,优化物品抓取、移动操作等任务的完成率。作为面向机器人垂直领域的专业数据集,lerobot_act的发布也进一步丰富了AI训练数据要素供给,为机器人行业的技术迭代提供了基础数据支撑。





_1769672084863.jpg)