当前具身智能已成为全球AI领域的核心落地赛道,机器人运动控制精度、环境导航能力的迭代,高度依赖真实场景采集的多维度标注数据集,但公开领域的高质量机器人实采数据集供给仍存在明显缺口,很大程度上制约了中小研发团队、学术机构的技术迭代效率。近日,开发者kenichiokamurajp正式上线record-test机器人控制专项数据集,该数据集于2026年5月9日首发于HuggingFace平台,是面向机器人研发场景的轻量化标注数据集。
kenichiokamurajp本次发布的record-test数据集,基于HuggingFace旗下专门面向具身智能领域的LeRobot开源工具链创建,属于机器人控制方向的专项标注数据集,共包含5个完整任务片段(episodes),总计3749帧有效标注数据。数据集完整记录了机器人执行任务全流程的两类核心数据:一是机器人运动控制相关数据,包括6自由度关节的动作指令、同步状态观测值,可直接用于运动控制算法的训练与验证;二是环境感知相关数据,包含机器人前视和顶部两个视角同步拍摄的视频,视频参数为480x640分辨率、30fps,可完整还原机器人作业过程中的全域环境信息。存储方面,结构化标注数据以高效压缩的parquet格式存储,视频以通用MP4格式存储,总数据量约600MB,其中结构化数据文件100MB,视频文件500MB,轻量化的存储设计便于开发者快速下载、部署调用。
作为真实场景采集的标注数据集,record-test的典型应用方向覆盖机器人研发多个核心场景:可用于机器人运动控制算法的精准度、泛化性测试,支撑机械臂轨迹规划、动态避障等技术的迭代;可用于视觉导航模型的训练,双视角同步视频能够支撑多视角视觉融合定位、复杂环境路径规划等技术的研发;也可用于具身智能多模态决策模型的小样本学习研究,完整的任务片段数据能够为端到端机器人决策模型提供真实场景的训练素材。当前全球具身智能产业正处于从实验室研发向商业化落地过渡的关键阶段,公开高质量数据集的开放共享,是降低行业研发门槛、推动技术普惠的重要基础,此次record-test数据集的发布,也将为机器人运动控制、视觉导航领域的中小研发团队、学术研究机构提供额外的优质数据供给,助力相关技术的快速迭代。





_1769672084863.jpg)