近年具身智能产业进入快速落地期,机器人操作、物体抓取作为具身智能的核心基础能力,其技术研发高度依赖高质量的多模态训练数据,但当前行业内覆盖动作参数、多视角视觉、深度感知的配套开源数据集供给仍存在缺口,成为制约中小研发团队、学术机构研发效率的核心瓶颈之一。
近日,SHRDC-MSF4-0正式对外发布g1_pack_items_wt_depth_buntings_backdrop数据集,该数据集由专注于具身智能训练数据建设的LeRobot团队创建,于2026年5月9日首发于全球最大的AI开源社区HuggingFace,定向服务机器人操作、物体抓取感知领域的技术研发需求。
据公开信息显示,该数据集共包含450个实机操作片段,总帧数达243105帧,覆盖4类典型机器人抓取任务场景;数据采用parquet格式存储,结构化数据文件总大小为100MB,配套视频文件大小为200MB,采样帧率为30fps,可直接适配多数深度学习模型的训练数据格式要求,降低研发团队的数据预处理成本。
从数据维度来看,该数据集同步覆盖机器人动作参数与环境感知数据两大类别:动作类特征包含机器人16个关节位置数据、左右夹持器实时位置数据,可完整还原机器人抓取操作的全链路运动逻辑;感知类特征包含左右手摄像头、头部摄像头三个视角的480x640分辨率视觉图像,以及配套的深度数据,可支撑模型对物体空间位置、外形、材质的多维度感知训练,填补了同类数据集普遍缺失的多视角深度感知数据空白。
从应用场景来看,该数据集可广泛应用于多个机器人研发方向:在工业场景中,可用于训练物流分拣、3C装配等场景的工业机器人抓取模型,提升复杂背景下不规则物体的抓取成功率;在服务场景中,可支撑家庭服务机器人、仓储机器人的物品操作能力优化,降低不同形态物体的误抓率、掉落率;在通用具身大模型研发中,多模态的动作-感知配套数据可支撑端到端操作模型的训练,提升机器人在陌生场景下的操作泛化能力。
作为面向机器人抓取场景的专项开源数据集,本次发布的产品进一步丰富了具身智能领域的高质量数据供给,可大幅降低相关研发团队的数据采集与标注成本,缩短模型迭代周期,对推动具身智能技术的落地普及、完善数据要素支撑的AI产业创新体系具有积极意义。
查看g1_pack_items_wt_depth_buntings_backdrop





_1769672084863.jpg)