当前,具身智能已成为全球人工智能产业落地的核心赛道之一,而覆盖动作、视觉、状态等多维度信息的高质量标注数据集,是支撑机器人控制模型迭代、计算机视觉算法优化的核心底层资源。此前,机器人领域的公开数据集普遍存在多模态数据不同步、标注维度不足、商业授权不清晰等问题,大幅提升了开发者的研发门槛。k1000dai本次发布的record-test数据集,是基于LeRobot创建的机器人相关专项数据集,于2026年4月23日率先在全球最大的开源AI模型与数据集社区HuggingFace上线,面向全球开发者开放获取。该数据集共包含3个数据子集,总帧数达3263帧,围绕1个典型机器人作业任务设计。数据集的结构化维度十分丰富:既包含动作数据(6个关节位置)、观察状态(6个关节位置)等机器人本体运行数据,也配套了手腕和顶部双视角的同步图像数据(分辨率为480x640,帧率30fps),同时附带时间戳、帧索引、集索引、索引和任务索引等全链路标注信息,可直接满足多模态模型训练的数据对齐需求。整个数据集的结构化数据文件总大小为100MB,视频文件总大小为200MB,轻量化的体积大幅降低了开发者的下载、调试门槛,适合快速算法验证、小样本模型训练等场景。值得关注的是,该数据集采用apache-2.0许可证,允许开发者自由修改、分发和商用,对学术研究和商业化项目均十分友好。从应用价值来看,record-test数据集可广泛覆盖两大核心领域的典型应用场景:在机器人控制领域,可支撑6自由度机械臂的运动轨迹规划、关节力矩控制算法的训练与验证,为工业机器人、协作机器人的控制模型开发提供标准化的测试基准;在计算机视觉领域,双视角同步的图像数据可用于机器人视觉定位、目标物体识别、姿态估计算法的优化,为具身智能体的环境感知能力训练提供可靠的数据支撑。





_1769672084863.jpg)