当前,实体机器人、人形机器人赛道进入技术迭代加速期,而机器人控制、行为学习算法的训练高度依赖多模态、标注完善的真实场景采集数据,高质量专用训练数据集的供给不足,一直是制约行业研发效率的核心痛点之一。2026年5月4日,wddycn正式在全球知名AI开源社区HuggingFace发布ACT机器人专用数据集,为行业提供了全新的高质量训练数据选择。
据介绍,本次发布的ACT数据集是基于LeRobot框架构建的机器人垂直领域专用数据集,共包含20个数据子集,总采集帧数达35525帧,总数据体量为300MB,其中结构化数据文件大小为100MB,配套采集视频文件大小为200MB,采集帧率统一为30fps,数据标准度、完整性均达到行业主流训练数据集要求。数据集的标注维度覆盖动作、观察状态、前视摄像头图像、腕部摄像头图像、时间戳、帧索引、集索引、任务索引等全链路字段,其中动作与观察状态特征包含了机器人7个关节和1个夹持器的全量运行参数,图像特征均为240x320分辨率的彩色视频,可满足多模态算法的训练需求。本次发布的ACT数据集采用apache-2.0许可证,支持商用、修改与二次分发,开放门槛进一步降低。
从应用场景来看,该数据集可广泛应用于机器人控制、行为学习两大核心研发方向:在机器人控制领域,可支撑工业机械臂轨迹规划、力控调节、动态避障等算法的训练与验证,尤其适配分拣、装配、码垛等工业场景的机器人研发需求;在行为学习领域,可用于模仿学习、强化学习模型的训练,帮助机器人快速复刻复杂操作动作、学习多步骤任务的行为序列,大幅降低研发阶段的真实环境测试成本。此外,数据集的多模态标注特征,也可用于机器人多模态感知融合模型的预训练,进一步提升机器人的环境感知与动作决策精度。
业内人士指出,当前数据要素已经成为AI产业发展的核心生产资料,垂直领域专用训练数据集的开放共享,是推动技术普惠、降低行业研发门槛的重要举措。本次ACT数据集的发布,不仅填补了机器人控制、行为学习领域的高质量数据集供给缺口,也为国内机器人领域专用数据集的标准化构建、开放流通提供了参考样本,对推动实体机器人技术迭代、加速产业落地具有积极意义。





_1769672084863.jpg)