当前具身智能产业正进入快速落地期,抓取、放置作为工业机器人、服务机器人最高频的核心操作场景,其算法训练高度依赖实机采集的结构化标注数据,但长期以来,面向细分任务的小体量、高可用性公开数据集供给不足,极大限制了中小研发团队、个人开发者的算法迭代效率。
近日,开发者omkarputti正式发布SO101_pick_and_place机器人操作专项数据集,该数据集于2026年5月6日率先上线HuggingFace平台,核心面向机器人操作控制、抓取放置任务研发场景,是少有的基于LeRobot框架构建的轻量级实机操作数据集。
据公开信息显示,omkarputti本次发布的SO101_pick_and_place数据集共包含66组完整操作序列(episodes)、22589帧标注数据,覆盖两类典型抓取放置任务。数据集结构化标注内容采用parquet格式存储,配套视觉素材采用mp4格式存储,总数据文件体积为100MB,配套视频文件体积为200MB,轻量属性大幅降低了开发者的下载、训练门槛。从数据维度来看,该数据集覆盖多类核心训练特征:既包含机器人6个关节的动作指令数据、实时状态观测数据,也配套了分辨率为480x640、帧率为30fps的前端第一视角视觉视频,同时同步标注了时间戳、帧索引、操作序列索引等关联字段,可满足端到端机器人操作模型的训练需求。
从应用潜力来看,该类抓取放置专项数据集可落地的典型场景十分广泛:既可以用于工业分拣场景的机器人控制算法训练,支撑3C电子元器件分拣、食品包装物料码放等细分场景的模型迭代;也可以为家庭服务机器人的桌面物品整理、快递递送等操作任务提供训练数据支撑;此外还可作为Sim2Real(模拟环境到真实环境迁移)算法的验证数据集,以及具身智能领域入门开发者的教学练习数据集。
业内分析指出,随着数据要素成为AI产业发展的核心生产资料,细分场景的高质量公开数据集是降低产业研发成本、加速技术落地的核心公共资源,本次SO101_pick_and_place数据集的发布,也为后续机器人操作类专项数据集的标准化构建提供了参考样本。





_1769672084863.jpg)