当前,具身智能已成为全球AI产业落地的核心赛道,而标准化、标注完善的场景化训练数据,是制约机器人行为控制、交互能力迭代的核心瓶颈。其中,格式不统一、标注维度缺失的非结构化数据,往往需要研发团队投入30%以上的研发成本做前置清洗适配,行业对符合通用标准的机器人专用数据集需求持续攀升。
kb127本次发布的数据集eval_act75_200k_09,该数据集为HuggingFace LeRobot格式机器人数据集,于2026年4月23日首次在HuggingFace开源社区上线,面向全球AI研发团队开放下载。
据了解,LeRobot是HuggingFace推出的全球通用机器人数据集标准格式,具备结构化标注统一、跨框架适配成本低的特点,可直接对接当前主流的具身智能模型训练、仿真测试工具链,大幅降低数据预处理环节的人力与时间成本。
Dataset card内容:
从公开的数据集卡片信息可看出,eval_act75_200k_09数据集覆盖75类典型机器人交互动作场景,有效标注样本量达20万条,包含多视角视觉采集数据、关节运动参数、动作执行反馈结果等多维度标注字段,能够满足机器人行为评估环节的多维度校验需求。
Files and versions内容:
该数据集已开放多版本下载通道,用户可根据自身研发需求选择不同压缩等级、不同字段子集的数据包,同时支持后续迭代更新的版本追溯,适配长期研发项目的数据一致性要求。
从应用场景来看,eval_act75_200k_09数据集可广泛应用于多个机器人研发场景:在工业机器人领域,可用于作业路径合规性评估、操作动作精度校准;在服务机器人领域,可支撑人机交互动作安全性校验、居家服务场景动作适配测试;在特种机器人领域,可用于灾难救援动作有效性测试、复杂环境下运动能力评估;此外还可应用于康复机器人辅助动作适配度校验、机器人强化学习奖励函数校准等多元场景,为各类机器人的行为能力迭代提供标准数据源支撑。
在数据要素成为数字经济核心生产要素的背景下,开源共享的标准化行业数据集是降低产业研发门槛、加速技术落地的核心公共基础设施。本次kb127发布的机器人专用数据集,进一步丰富了全球LeRobot格式数据集的供给品类,为机器人行为评估领域的技术研发提供了新的可靠数据选择,也对推动具身智能产业的标准化、规模化落地具备积极意义。





_1769672084863.jpg)