近年来,随着人形机器人、工业协作机器人赛道的快速爆发,机器人控制算法的研发对高质量、多模态的标注训练数据需求持续攀升。但由于真机数据采集成本高、标注流程复杂,面向关节控制、视觉伺服等核心场景的标准化数据集供给仍存在较大缺口,成为制约机器人控制算法迭代的核心瓶颈之一。近日,科技机构Fantasyyy正式发布机器人控制数据集record-test,该数据集于2026年5月18日首发于全球知名AI开源社区HuggingFace,主要面向机器人关节控制、视觉伺服学习两大核心研发场景开放使用。
Fantasyyy本次发布的数据集record-test为专用机器人控制数据集,基于LeRobot工具创建完成。数据集共包含5个训练集(episodes),总计1844帧标注数据,采样率为30fps,所有数据均采集自so101_follower机器人真机运行过程,覆盖三大类核心标注维度:一是机器人动作数据,包含6自由度关节位置标注;二是观测状态数据,同步标注6自由度关节实时位置;三是多视角视觉观测数据,同步收录手腕视角、侧面视角两个摄像头的同步视频素材,视频分辨率为480x640。该数据集采用parquet格式存储,结构化数据文件总大小为100MB,配套视频文件大小为200MB,内置特征维度覆盖动作、观测状态、时间戳、帧索引等核心字段,可直接对接主流机器人控制模型训练框架。
从应用价值来看,该数据集对齐了关节状态数据与多视角视觉数据的时间戳,可支持多类机器人控制算法的研发与验证:在机器人关节控制场景,研发人员可基于标注的6自由度关节动作与状态数据,训练机械臂轨迹规划、力控阻抗调节等模型,提升工业装配、物料搬运等场景下协作机器人的操作精度与稳定性;在视觉伺服学习场景,结合双视角视觉数据与关节状态的同步标注,可开发基于视觉反馈的实时控制算法,支撑动态目标抓取、复杂环境避障等功能的落地;此外,该数据集也可作为Sim2Real(仿真到真实环境迁移)算法的验证基准,帮助研发团队降低真机调试成本,提升算法的环境适配性。
作为面向机器人控制领域的开源标准化数据集,record-test的发布也为国内机器人行业的开源生态建设提供了新的供给。当前数据要素已成为人工智能与实体产业融合的核心生产资料,面向垂直场景的高质量标注数据集,不仅能够降低中小研发团队的数据集采集门槛,也能够推动不同团队研发的算法实现统一基准验证,加速机器人控制技术的迭代效率,为通用机器人的规模化落地提供基础支撑。





_1769672084863.jpg)