当前全球机器人产业正处于向通用化、智能化升级的关键周期,以世界模型为核心的技术路径成为机器人实现自主决策、环境适配的核心方向,而同时覆盖运动动作、视觉观测、时序状态的高标注训练数据,一直是制约相关技术迭代的核心供给瓶颈。近日,开发者julie-trrsr正式对外发布SO101-world-model-5fps数据集,该数据集由LeRobot创建,专门面向机器人技术研发场景,已于2026年5月5日率先在HuggingFace平台上线。
从公开的数据集结构来看,该数据集配置了完备的元数据文件info.json,详细标注了数据集的核心特征、视频参数、动作维度与观测状态等信息,方便研发者快速调用适配。目前该数据集包含1个完整episode、共107帧采样率为5fps的视频数据,核心标注特征覆盖四大类:第一是动作特征,包含肩部、肘部、腕部和夹持器的精准位置数据,可直接匹配机械臂、人形机器人上肢的运动控制训练需求;第二是观测状态特征,与动作特征维度完全对齐,可支撑动作-状态闭环的算法训练;第三是前视图像数据,分辨率为1080x1920、3通道、采样率5fps,完全还原机器人第一视角的视觉采集参数;此外还配套了时间戳、帧索引、episode索引等时序标注信息,可满足时序依赖类模型的训练要求。该数据集采用apache-2.0开源许可证,学术机构、企业研发团队均可在合规范围内免费使用,大幅降低了相关技术的研发门槛。
Dataset card内容:
Files and versions内容:
从应用价值来看,该数据集可广泛覆盖机器人领域的多个核心研发场景:在运动控制方向,可用于机械臂轨迹规划、柔顺控制、人形机器人动作模仿学习等算法的训练与验证;在视觉感知方向,可支撑机器人第一视角目标识别、场景理解、动态障碍物检测等模型的优化;在世界模型研发方向,多维度对齐的标注数据可帮助模型学习动作执行与环境变化、自身状态变化的映射关系,提升机器人的预判决策能力。作为机器人训练数据集领域的新增供给,本次开源数据集的发布,也进一步丰富了全球机器人领域高质量训练数据的供给池,对推动数据要素在AI研发领域的流转应用、加快机器人智能化技术的落地迭代均有积极意义。





_1769672084863.jpg)