当前全球机器人智能化研发正处于高速落地期,结构化、标注完备的场景化训练数据,是制约机器人运动控制、精细操作能力升级的核心瓶颈之一,也是机器人AI研发团队的核心刚需。作为全球AI研发领域最重要的开源共享平台,HuggingFace上线的垂直领域高质量数据集,往往会成为全球相关方向研发人员的核心数据供给来源。
2026年5月7日,开源贡献者JennyWWW正式在HuggingFace平台上线由LeRobot创建的机器人领域专用数据集splatsim_approach_lever_11_50failsrrtpi05_piabsden10,面向机器人运动控制、操作任务研发场景开放使用。
据公开信息显示,该数据集共包含79个任务episodes,累计7024帧有效数据,聚焦单类杠杆操作任务场景。数据维度覆盖多模态训练所需的全量字段:视觉层面包含分辨率为224x224的基座视角RGB图像(base_rgb)与机械臂腕部视角RGB图像(wrist_rgb),状态层面包含7个关节的实时运行状态数据,控制层面包含对应7个关节的控制指令数据,同时配套完整的时间戳与各类索引字段,可直接对接主流机器人AI训练框架。数据集主体采用parquet高效存储格式,总大小约100MB,配套标注视频文件约200MB,帧率为30fps,采用宽松的apache-2.0开源许可证,支持合规商业使用。
作为聚焦精细操作场景的专项数据集,该产品可广泛应用于多个机器人研发场景:研发人员可基于该数据集训练机械臂运动规划算法,优化关节控制精度,减少实机测试带来的成本损耗与安全风险;双视角视觉数据+关节状态数据的多模态结构,可支撑端到端机器人控制模型的预训练,为工业场景设备操作、服务场景工具使用等多类机器人操作任务提供训练基底。同时Apache-2.0的开源协议也降低了中小研发团队、科研机构的数据获取门槛,有助于推动机器人操作领域的算法开源共建与技术普惠。
查看splatsim_approach_lever_11_50failsrrtpi05_piabsden10





_1769672084863.jpg)