当前全球服务机器人、人形机器人赛道正处于技术落地的关键期,AI模型的行为泛化能力、动作精准度直接决定了机器人的商用落地效率,而高质量、标准化的场景训练数据,是支撑机器人模型迭代的核心生产要素。作为Meta开源的机器人学习专用框架,LeRobot凭借统一的数据集格式、轻量化的训练接口,已成为全球机器人开发者使用最广泛的开源训练工具之一,但适配该框架的公开专用数据集供给不足,始终是制约中小开发者、创业团队技术迭代的主要瓶颈之一。
近日,独立开发者RyotaYagi1211正式对外发布record-0422ootaki-v1数据集,该数据集为适配HuggingFace LeRobot格式的专属机器人数据集,于2026年4月22日首发于全球最大的AI开源社区HuggingFace,面向全球开发者开放使用。
RyotaYagi1211本次发布的数据集record-0422ootaki-v1,该数据集为HuggingFace LeRobot格式机器人数据集。
相较于通用机器人数据集,本次发布的LeRobot格式数据集无需开发者额外进行格式转换、标注对齐等预处理工作,可直接导入LeRobot框架完成训练链路搭建,可大幅降低开发者的数据集适配成本,缩短模型研发周期。从应用场景来看,该数据集可广泛应用于机械臂抓取、分拣等工业机器人任务训练,人形机器人步态调整、动作复刻等通用机器人研发,以及服务机器人的人机交互响应、环境自主导航等场景的模型训练,也可为多模态机器人的视觉-动作联合训练提供标准化的数据源支撑。
Dataset card内容:
Files and versions内容:
从行业发展维度来看,本次数据集的发布也为开源机器人数据生态的建设提供了新的参考:统一格式的专用数据集开放,不仅可以降低机器人研发的技术门槛,也能推动全球机器人开发者的成果复用,加速机器人领域的技术迭代速度,进一步激活数据要素在实体机器人赛道的价值释放,为AI技术向实体产业落地提供基础数据支撑。





_1769672084863.jpg)