近年来,随着具身智能赛道商业化进程提速,机器人自主操作、人机协同等技术的落地需求持续攀升,但不同于大语言模型可依托海量公开文本完成训练,机器人操作领域的高质量真实场景多模态标注数据始终是行业稀缺资源——尤其是针对开抽屉、取放物品这类日常高频、对操作精细度要求较高的任务,现有数据集普遍存在样本量不足、视觉与动作数据匹配度低、场景覆盖单一等问题,直接制约了相关算法的泛化能力与落地效果。
2026年5月11日,CoRL2026-CSI正式对外发布SO101-Teleop-Open_drawer_100epi机器人操作专用数据集,该数据集首发上线全球知名AI开源平台HuggingFace,面向全球科研机构、机器人企业开放使用,核心面向机器人操作控制、视觉伺服操作两大研究领域提供数据支撑。
据了解,本次发布的数据集基于LeRobot工具创建,聚焦遥操作打开抽屉这一典型机器人操作任务,共包含100个episode样本,总帧数达22458,数据采集搭载SO follower机器人平台,覆盖动作、观察两类核心数据:其中动作数据包含机器人关节位置等核心控制参数,观察数据包含手腕摄像头、顶部摄像头双视角采集的图像信息,采集帧率为30fps,视频采用H.264格式编码,图像分辨率为480x640,全量数据采用Parquet文件结构存储,可直接适配主流机器人学习与控制研究框架,兼容性强、预处理成本低。
作为聚焦细粒度操作场景的专用数据集,SO101-Teleop-Open_drawer_100epi可支撑多个方向的研究与应用:基于双视角视觉数据与关节动作数据的关联标注,可用于训练机器人的视觉伺服定位能力,提升机器人对操作对象姿态、位置的识别精度;大规模真实遥操作样本可用于训练机器人自主操作策略,缩小仿真数据到真实物理场景的迁移误差;还可作为家庭服务机器人、工业仓储分拣机器人操作模块的预训练数据集,提升机器人在开柜、取放物品等高频场景的操作成功率,降低相关技术的研发门槛。
该数据集的发布,进一步丰富了机器人精细操作领域的训练数据供给,对于推动具身智能领域的技术迭代、加速机器人操作技术的商业化落地具有重要的支撑价值。
查看SO101-Teleop-Open_drawer_100epi





_1769672084863.jpg)