当前,全球机器人产业正从专用化向通用化加速演进,机器人操作控制、视觉动作识别等核心技术的迭代高度依赖高质量训练数据,而实机场景下的多模态数据集采集涉及硬件投入、动作标注、场景还原等多重成本,长期以来是机器人研发领域的供给短板。近日,开发者Bekhzod正式推出由开源机器人项目LeRobot打造的fr3_real_dataset_recording_test1数据集,该数据集于2026年5月2日首发于全球知名AI开源社区Hugging Face,主要面向机器人技术研发领域开放使用。
本次公开的fr3_real_dataset_recording_test1数据集覆盖机器人实机操作全链路多维度特征,具体包含三大类核心数据:一是机器人状态数据,涵盖动作维度的x、y、z方向位移、旋转参数和夹持器状态,以及观察维度的位置、旋转、夹持器运行状态;二是视觉感知数据,包含机器人前部、顶部双视角采集的480x640分辨率3通道图像视频,帧率为30fps,可还原操作全流程的视觉场景;三是索引标注数据,包含时间戳、帧索引、剧集索引、任务索引等结构化标注信息,方便研发人员快速调取对应场景数据。数据集结构化内容采用parquet格式存储,视频内容采用通用mp4格式存储,适配主流AI训练框架的读取需求。
从典型应用场景来看,该实机采集数据集可广泛应用于机器人领域的多个研发方向:可用于工业协作机器人精细抓取、物料转运等场景的路径规划算法训练,提升视觉伺服控制的精度与稳定性;可支撑通用人形机器人动作大模型的实机动作对齐训练,降低仿真数据到真实场景的迁移误差;也可为机器人操作安全策略优化、异常动作识别、多任务泛化能力验证等研究提供基础数据支撑,有效降低中小研发团队的实机数据采集成本。
作为机器人领域的新增开源数据资源,fr3_real_dataset_recording_test1数据集的上线进一步丰富了全球开源机器人数据集的供给品类,对推动机器人操作控制技术普惠化发展、加速数据要素在智能制造、人形机器人等前沿领域的流通应用具有积极意义。
查看fr3_real_dataset_recording_test1





_1769672084863.jpg)