随着具身智能产业进入快速落地期,高质量、场景化的标注训练数据已经成为机器人控制算法迭代的核心瓶颈,尤其是面向工业级协作机器人的多模态数据集,因采集成本高、标注难度大、标准化程度不足,长期以来是行业稀缺的核心数据资源。
2026年5月24日,科技团队MidoriChou正式发布全新机器人学数据集ai_final_4,为Franka Panda协作机器人相关研发提供了标准化的数据底座。据悉,该数据集采用HuggingFace推出的LeRobot工具链创建,作为行业通用的机器人学习数据采集与处理工具,LeRobot生成的数据集可直接对接主流机器人学习框架,大幅降低研发团队的数据适配成本。
本次发布的ai_final_4数据集共包含70个episodes,总计35350帧数据,采样帧率为30fps,覆盖多维度的机器人运行全链路数据:核心数据结构包括8维浮点数组格式的动作数据、记录9个关节位置的观测状态数据,以及来自手腕、前方两个视角的480x640分辨率3通道彩色视频图像,同时配套了时间戳、帧索引、episode索引等完整元数据,实现了机器人视觉感知、运动状态、动作指令的全维度数据对齐。存储层面,结构化数据采用大数据领域通用的Parquet列式存储格式,具备更高的读取与批量加载效率,可适配大模型训练时的高吞吐数据调用需求;视频数据则采用兼容性更强的MP4格式存储,可满足不同技术路线的研发预处理需求。
从应用场景来看,该数据集可广泛适配机器人控制、模仿学习、强化学习等多个研发方向:基于对齐的视觉与关节数据,研发团队可训练Franka Panda机器人的精密抓取、工业装配等场景的模仿学习算法,也可用于动态避障、人机协作等复杂场景的强化学习模型训练,还可作为基准数据集用于不同机器人控制算法的效果评测,大幅降低相关研发团队的自主数据采集成本,加快算法迭代效率。
Dataset card内容:
Files and versions内容:
在数据要素驱动AI产业发展的背景下,场景化垂直数据集的开放共享正在成为推动技术普惠的核心动力。本次ai_final_4数据集的发布,不仅为Franka Panda机器人相关研发提供了高质量的训练数据支撑,也为工业机器人领域数据集的标准化制作提供了参考样本,有望进一步推动协作机器人在工业制造、科研教育等领域的落地应用。





_1769672084863.jpg)