当前具身智能产业正处于技术迭代与场景落地的关键阶段,标准化、多模态的实机训练数据是支撑机器人控制算法研发的核心生产要素,尤其是面向细分类型机器人的标注数据集长期供给不足,大幅抬高了中小研发团队、高校科研团队的技术研发门槛。
2026年5月11日,开源贡献者kb127正式上线eval_act66机器人专用数据集,该数据集基于LeRobot框架构建,专门适配so_follower类型机器人,目前已在HuggingFace平台开放获取。
从公开的数据集参数来看,eval_act66共收录5个完整的机器人操作情节,累计7430帧采样数据,采样帧率为30fps,完整覆盖机器人单次任务的全动作链路;数据整体采用分块Parquet文件格式存储,总数据文件大小为100MB,配套视频文件大小为200MB,所有数据全部划入训练分割集,可直接接入算法训练流程,大幅降低开发者的数据预处理成本。该数据集为典型的多模态标注数据集,涵盖的特征维度包括:6维动作数值(对应肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置核心关节控制量)、与动作维度对应的6维观察状态数据、前部+顶部双视角480x640分辨率3通道AV1编码彩色视频数据,以及配套的时间戳、帧索引、情节索引、任务索引等结构化标注信息。
从应用方向来看,eval_act66可广泛适配各类机器人控制与学习任务:在模仿学习场景中,开发者可基于同步的视觉与关节标注数据,训练机器人复现示教动作,支撑工业装配、家用服务等场景的动作研发;在强化学习场景中,标准化的关节状态标注可帮助开发者快速优化关节控制算法,提升机器人运动的平顺性与精度;此外该数据集还可用于多模态感知算法训练,探索“视觉输入-动作输出”的端到端控制方案,降低机器人对高成本硬件传感器的依赖。
Dataset card内容:
Files and versions内容:
作为具身智能领域最新的开源数据集成果,eval_act66的发布进一步丰富了细分类型机器人的训练数据供给,对于降低具身智能研发门槛、推动行业开源协同发展具有积极作用。





_1769672084863.jpg)