近年,具身智能成为AI与智能制造领域的核心赛道,机械臂的自主控制、精准抓取能力是工业自动化、智慧物流、服务机器人落地的核心支撑,而算法训练高度依赖覆盖多场景、多维度的实机采集数据。此前行业内高质量的开源机械臂操作数据集供给相对稀缺,尤其是同时覆盖机械臂运行状态、动作指令、环境参数的结构化数据集不足,大大抬高了中小研发团队的技术准入门槛。2026年5月7日,Elianak在全球最大的AI开源社区HuggingFace首发act_v3_1d_all数据集,为机器人领域的研发团队提供了新的高质量数据选择。
该数据集由知名开源机器人项目LeRobot创建,面向机械臂控制、物体抓取领域开放,总计包含352个完整任务序列(episodes)、84925帧采样数据,采集频率为20fps,结构化数据采用大数据领域通用的parquet格式存储,方便开发者快速读取与处理,其中结构化数据文件大小为100MB,配套视频文件大小为500MB。值得注意的是,数据集采用对商业应用极为友好的Apache 2.0许可证开放,开发者可自由修改、分发数据集,甚至可将其用于商业产品的研发迭代,无需额外授权。
从数据维度来看,act_v3_1d_all覆盖三大类核心特征,可充分满足机械臂抓取算法的训练需求:一是16维浮点型动作数组,对应机械臂的操作指令序列,可直接用于算法的动作输出模块训练;二是46维观测状态数组,完整包含左右机械臂的实时位置、夹持器开合状态等核心运行参数,可还原机械臂操作的全链路运行状态;三是14维环境状态数组,覆盖任务场景中目标立方体、橙色立方体的位置和姿态数据,完整还原抓取任务的环境变量,支持算法对环境扰动的适应性训练。
从应用价值来看,该数据集的典型应用方向覆盖多个产业场景:在工业制造领域,可用于机械臂的无序分拣、高精度装配、物料搬运等算法的训练与验证,降低产线自动化改造的研发成本;在服务机器人领域,可支撑家用物品拾取、辅助照料操作等功能的算法迭代;同时也可用于具身智能通用大模型的微调、多机械臂协作策略的仿真验证等前沿研发方向,有效减少研发团队的实机数据采集投入,缩短技术落地周期。
本次数据集的开放,是开源社区完善机器人领域数据要素供给的重要动作,将进一步推动机械臂控制技术的普惠化发展,为数据要素在智能制造领域的流转应用提供典型样本,助力具身智能产业的落地提速。





_1769672084863.jpg)