近年来,随着具身智能、通用机器人赛道的快速升温,标准化训练数据稀缺已经成为制约行业技术迭代的核心痛点之一。不同研发团队产出的机器人训练数据往往存在格式不统一、标注标准不一致、跨场景复用难度大等问题,大幅抬高了算法研发的前置成本。在此背景下,适配主流开源生态的标准化数据集正成为行业刚需资源。
近日,机构ameimei正式对外发布exp2_sim_wide_blue机器人数据集,该数据集于2026年4月22日首发上线HuggingFace平台,是国内为数不多的采用HuggingFace LeRobot标准格式开发的仿真类机器人数据集,为全球具身智能研发团队提供了全新的高质量数据选择。
据了解,HuggingFace推出的LeRobot是当前全球具身智能领域应用最广泛的开源数据框架之一,专门面向机器人研发场景设计了统一的数据结构、标注规范与调用接口,研发团队接入该格式数据集后可直接开展算法训练,无需额外完成格式转换、标注对齐等预处理工作,大幅降低数据准备环节的人力与时间投入。
从应用价值来看,作为仿真类机器人训练数据集,exp2_sim_wide_blue可支撑多类研发场景的需求:包括工业机器人柔性抓取策略训练、服务机器人室内运动路径规划仿真、具身智能大模型的预训练与微调、多模态人机交互算法模拟测试等,研发团队可基于该数据集快速开展算法原型验证,减少真实环境测试带来的硬件成本消耗与安全风险。
ameimei本次发布的数据集exp2_sim_wide_blue,该数据集为HuggingFace LeRobot格式机器人数据集。
Dataset card内容:
Files and versions内容:
从行业发展角度来看,此次exp2_sim_wide_blue数据集的发布,是国内垂直领域AI训练数据供给侧的一次重要补充。随着我国数据要素市场建设的持续推进,高质量细分场景数据集的开放共享,将进一步降低前沿技术研发的门槛,为具身智能、工业机器人等产业的创新落地提供重要的基础支撑。





_1769672084863.jpg)