随着全球协作机器人、服务机器人落地进程持续提速,模仿学习作为机器人快速习得精细化操作技能的核心技术路径,对高标注质量、多模态融合的真实场景训练数据的需求正持续攀升。作为机器人技术研发的核心生产要素,垂直场景专用训练数据集的供给能力,直接决定了相关技术的迭代效率与落地可行性。
近日,开发者andyv237正式对外发布so101-clean-desk-merged数据集,该数据集由LeRobot打造,于2026年5月14日首发于HuggingFace平台,是一款专门面向桌面场景机器人任务开发的训练数据集。本次公开的数据集共包含36个总集数、13740个总帧数,覆盖单一标准化桌面操作任务的全流程数据。
从数据结构来看,该数据集覆盖三大类核心数据维度:其一为动作特征数据,包含肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕滚动和夹爪位置六大核心关节控制参数,完整还原机器人操作过程中的全维度动作指令;其二为状态观察特征数据,维度与动作特征完全对齐,可用于训练过程中的动作执行效果校验,提升模型控制精度;其三为图像观察特征数据,包含来自手腕摄像头、顶部摄像头双视角的1080x1920分辨率视频素材,帧率达30fps,可支撑多模态视觉-动作联合模型的训练需求。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,读写效率更高,可直接适配主流AI训练框架调用,视频素材则采用兼容性极强的mp4格式存储,方便开发者进行二次标注、预处理等操作。目前该数据集适配so_follower类型机器人,可直接用于机器人控制相关研究与开发工作。
从应用方向来看,该类桌面操作数据集可广泛应用于多个机器人研发场景:可用于桌面物品抓取、摆放、整理等灵巧操作的模仿学习训练,帮助机器人快速复现人类标准化操作动作;可用于机器人控制算法的效果验证,通过对比数据集标注的标准动作参数与算法输出的控制参数,迭代优化控制算法的响应精度与稳定性;也可与其他场景的机器人操作数据集融合训练,拓展机器人多任务处理能力,为办公助理机器人、工业桌面装配机器人、家用整理机器人等产品的研发提供数据支撑。
当前我国数据要素市场建设正持续深化,AI训练数据作为人工智能领域的核心数据要素,其公开共享程度直接影响产业创新效率。本次so101-clean-desk-merged数据集的开放,丰富了公开市场上桌面场景标准化机器人操作训练数据的供给,降低了中小研发团队、学术机构在机器人灵巧控制领域的研发门槛,对推动机器人模仿学习技术的普惠式创新具有积极意义。





_1769672084863.jpg)