当前全球具身智能产业正处于技术落地的关键窗口期,机器人控制算法、强化学习模型的迭代对高质量、结构化的专用训练数据需求持续攀升,但长期以来,针对特定机型的多模态开源数据集供给不足,大量中小研发团队需要自行完成数据采集、标注、清洗工作,大幅抬高了研发门槛。近日,AI开发者TokTok9999正式对外发布机器人专用数据集eval_act_eraser_v3,该产品于2026年5月23日首发于全球最大的AI模型与数据集共享平台HuggingFace,面向机器人动作控制、强化学习领域开放使用。
据了解,本次发布的eval_act_eraser_v3数据集基于HuggingFace官方推出的机器人学习开源工具栈LeRobot构建,专门适配so_follower类型协作机器人,数据维度覆盖机器人研发的核心需求:其中动作数据包含肩部、肘部、腕部和夹爪的位置参数,可直接作为模仿学习、动作规划任务的标签数据;状态观测数据同步采集同维度关节位置信息,可支撑算法训练中的状态校验、闭环控制逻辑优化;图像观测数据则包含来自手腕摄像头、顶部全局摄像头的两路视频流,分辨率为480x640、3通道、帧率30fps,能够满足视觉伺服、多模态端到端控制等前沿方向的训练需求。
在存储与结构设计上,eval_act_eraser_v3采用大数据领域通用的parquet格式存储结构化数据,视频流单独以mp4格式存储,同时内置时间戳、帧索引、episode索引、任务索引等标准化元数据,可直接兼容主流强化学习框架、机器人仿真平台,大幅降低开发者的数据适配成本。
从应用场景来看,该数据集可广泛应用于协作机器人精细操作算法研发、强化学习模型基准测试、多模态机器人控制方案落地等多个方向:比如工业分拣、3C装配等场景的机械臂动作模型训练,可直接调用数据集的关节动作与视觉对应关系完成预训练;不同研发团队的强化学习算法效果对比,也可基于该标准化数据集完成基准测试,避免自采数据带来的结果不可比问题。该数据集的发布也为机器人开源数据生态提供了新的供给,对降低具身智能研发门槛、推动控制算法的开源共享具有积极意义。





_1769672084863.jpg)