five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开发者andyv237发布so101-clean-desk-merged数据集 为机器人模仿学习与灵巧控制提供专用训练支撑

五号数据雷达开源数据市场2026-05-15 00:108
近日,开发者andyv237于2026年5月14日在HuggingFace平台首发由LeRobot打造的so101-clean-desk-merged机器人任务专用数据集,覆盖多维度动作、状态及视觉数据,可直接支撑机器人模仿学习、灵巧操作控制领域的研究与开发需求。

随着全球协作机器人、服务机器人落地进程持续提速,模仿学习作为机器人快速习得精细化操作技能的核心技术路径,对高标注质量、多模态融合的真实场景训练数据的需求正持续攀升。作为机器人技术研发的核心生产要素,垂直场景专用训练数据集的供给能力,直接决定了相关技术的迭代效率与落地可行性。

近日,开发者andyv237正式对外发布so101-clean-desk-merged数据集,该数据集由LeRobot打造,于2026年5月14日首发于HuggingFace平台,是一款专门面向桌面场景机器人任务开发的训练数据集。本次公开的数据集共包含36个总集数、13740个总帧数,覆盖单一标准化桌面操作任务的全流程数据。

从数据结构来看,该数据集覆盖三大类核心数据维度:其一为动作特征数据,包含肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕滚动和夹爪位置六大核心关节控制参数,完整还原机器人操作过程中的全维度动作指令;其二为状态观察特征数据,维度与动作特征完全对齐,可用于训练过程中的动作执行效果校验,提升模型控制精度;其三为图像观察特征数据,包含来自手腕摄像头、顶部摄像头双视角的1080x1920分辨率视频素材,帧率达30fps,可支撑多模态视觉-动作联合模型的训练需求。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,读写效率更高,可直接适配主流AI训练框架调用,视频素材则采用兼容性极强的mp4格式存储,方便开发者进行二次标注、预处理等操作。目前该数据集适配so_follower类型机器人,可直接用于机器人控制相关研究与开发工作。

从应用方向来看,该类桌面操作数据集可广泛应用于多个机器人研发场景:可用于桌面物品抓取、摆放、整理等灵巧操作的模仿学习训练,帮助机器人快速复现人类标准化操作动作;可用于机器人控制算法的效果验证,通过对比数据集标注的标准动作参数与算法输出的控制参数,迭代优化控制算法的响应精度与稳定性;也可与其他场景的机器人操作数据集融合训练,拓展机器人多任务处理能力,为办公助理机器人、工业桌面装配机器人、家用整理机器人等产品的研发提供数据支撑。

当前我国数据要素市场建设正持续深化,AI训练数据作为人工智能领域的核心数据要素,其公开共享程度直接影响产业创新效率。本次so101-clean-desk-merged数据集的开放,丰富了公开市场上桌面场景标准化机器人操作训练数据的供给,降低了中小研发团队、学术机构在机器人灵巧控制领域的研发门槛,对推动机器人模仿学习技术的普惠式创新具有积极意义。

查看so101-clean-desk-merged

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们