当前全球具身智能产业正处于技术落地的关键窗口期,机器人模仿学习、人机协同控制作为支撑机器人通用能力的核心技术方向,长期面临高质量标注训练数据稀缺、不同来源数据集格式不兼容导致的研发适配成本偏高等行业痛点。为统一机器人训练数据标准、降低跨团队数据共享门槛,HuggingFace此前专门推出LeRobot机器人数据集通用格式,为全球研发群体提供了可兼容、可复用的标准化数据框架,大幅提升了机器人训练数据的流转效率。
近日,aytsaiusc正式发布play_human_2数据集,该数据集是符合HuggingFace LeRobot格式的专用机器人训练数据集,于2026年5月15日率先在HuggingFace平台上线,为全球具身智能研发团队提供了新的高质量数据选择。
作为聚焦人类行为轨迹与交互动作的训练数据集,play_human_2的核心应用价值主要覆盖两大前沿研发场景:其一在机器人模仿学习领域,研发团队可基于数据集标注的人类动作样本,训练机器人复现各类精细化操作,包括工业生产场景的零件装配、物流场景的货物分拣搬运、家庭服务场景的日常家务操作等,有效缩短机器人动作模型的训练周期;其二在人机交互控制领域,数据集覆盖的多类型人机交互动作样本,可用于训练机器人对人类动作意图的识别与响应能力,支撑工业人机协同作业、公共服务场景人机互动、家庭场景陪护机器人响应等多类应用的算法优化。
aytsaiusc本次发布的数据集play_human_2,该数据集为HuggingFace LeRobot格式机器人数据集。
Dataset card内容:
Files and versions内容:
从数据要素产业视角来看,play_human_2数据集的发布,也为国内机器人训练数据的标准化建设提供了参考样本。随着更多符合通用格式的高质量训练数据集开放共享,将进一步降低具身智能领域中小研发团队的准入门槛,推动我国具身智能产业的技术迭代,加速各类商用、民用机器人产品的落地进程。





_1769672084863.jpg)