当前,全球机器人产业正进入技术落地与场景渗透的关键周期,AI大模型与机器人技术的融合加速,使得同时覆盖运动控制参数、同步视觉信号的高质量标注数据集,成为制约机器人控制、视觉感知等核心技术迭代的核心瓶颈之一。作为支撑AI研发的核心数据要素,公开共享的垂直领域专业数据集,可有效降低中小研发团队的测试数据采集成本,推动整个行业的技术创新效率提升。
近日,机器人技术研发机构Nesaispas正式对外发布机器人领域专用数据集record-test_7,该数据集由LeRobot团队创建,于2026年4月22日率先上线全球最大的AI开源社区HuggingFace,面向全球研发团队开放使用,主要可应用于机器人控制、视觉感知两大核心技术领域的研发工作。
公开信息显示,record-test_7数据集共包含10个episodes、3405帧标注数据,对应1项机器人专项任务。数据集结构化数据采用parquet格式存储,总大小为100MB;配套视频文件采用mp4格式存储,总大小为200MB,采样帧率为30fps。其标注特征覆盖多个研发核心维度:包括机器人6个关节的动作指令参数、6个关节的实时观察状态数据、分辨率为480x640x3的宏观与微观同步视频帧,同时配套时间戳、帧索引、episode索引等关联字段,可满足多模态模型训练的对齐需求。
从数据特征的适用场景来看,record-test_7实现了机器人运动状态与视觉感知信号的同步标注,可为多个细分研发场景提供支撑:在机器人控制领域,数据集标注的关节位置参数可用于机械臂轨迹规划算法、柔顺控制模型的训练与效果验证,减少研发团队自行搭建实体测试环境、采集标注运动数据的投入;在视觉感知领域,同步采集的多维度图像数据与运动状态标签结合,可支撑视觉伺服控制、动态环境识别、目标物体定位等方向的模型训练,覆盖工业分拣、服务机器人环境交互等典型应用的前期研发需求。
Dataset card内容:
Files and versions内容:
业内人士指出,当前机器人领域的公开数据集普遍存在维度单一、标注不全的问题,尤其是同时覆盖运动控制与视觉感知的同步数据集供给不足,本次record-test_7的发布,进一步补充了该细分领域的公开数据资源,为全球机器人研发人员提供了新的训练数据选择,也为数据要素赋能硬科技研发提供了典型样本。





_1769672084863.jpg)