当前,具身智能已成为全球科技领域的核心赛道之一,机器人操作控制、视觉感知等核心技术的迭代高度依赖高质量实采数据集的支撑,然而受实机采集成本高、场景覆盖难度大等限制,专用机器人数据供给不足已成为制约中小研发团队技术落地的核心瓶颈。近日,数据提供方radoolonto正式发布peg_rand_05_01_cam_reference_cam0_1数据集,该产品于2026年5月2日首次上线HuggingFace平台,面向机器人研发领域开放。
据介绍,本次发布的数据集是使用LeRobot创建的专用机器人数据集,共包含85个episodes,总计45,695帧有效数据。数据集采集采用Franka机器人作为载体,采样频率为15fps,同步覆盖了来自两个摄像头(cam0和cam1)的图像观测数据、机器人实时状态观测数据、动作指令数据以及各类索引标签,所有数据以parquet文件格式存储并附带原始视频文件,可适配主流机器学习框架直接调用,大幅降低研发人员的数据预处理成本。
从应用场景来看,该数据集可广泛应用于机器人操作控制、视觉感知两大核心领域的技术研发:在视觉感知方向,多视角的实采图像数据可支撑多视角视觉定位、动态目标识别、3D场景重建等算法的训练与验证,帮助机器人提升复杂作业场景下的环境感知精度;在操作控制方向,匹配的状态-动作对应数据可用于末端执行器路径规划、力控交互策略、动态任务调度等算法的训练,尤其是针对工业装配、精密分拣、实验室自动化等Franka机器人的主流应用场景,能够有效降低算法从仿真环境到实机落地的“Sim2Real”误差,提升技术落地效率。
作为具身智能领域的新增数据供给,本次数据集的发布一方面填补了细分场景下的实采机器人数据缺口,降低中小研发团队的实机数据采集成本,另一方面也为机器人多模态数据集的标准化构建提供了参考样本,助力数据要素市场在具身智能细分领域的落地完善。
查看peg_rand_05_01_cam_reference_cam0_1





_1769672084863.jpg)