five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

艾伦AI研究所发布堆叠杯OOD机器人操作数据集 支撑灵巧操作与模仿学习技术研发

五号数据雷达开源数据市场2026-05-21 04:2615
2026年5月20日,前沿AI研究机构Allen Institute for AI(艾伦人工智能研究所)在Hugging Face首发eval_cosmos_cup_stacking_ood数据集,该数据集聚焦双机械臂堆叠杯操作场景,可为机器人灵巧操作算法研发、模仿学习模型训练提供高质量标注数据支撑。

当前人形机器人、工业协作机器人赛道正进入落地攻坚期,灵巧操作能力作为机器人替代人力完成精细化任务的核心指标,其算法迭代高度依赖高质量场景化训练数据,尤其是分布外(OOD)场景数据集,直接决定了机器人模型在真实复杂环境下的泛化能力与鲁棒性。近日,全球知名前沿AI研究机构Allen Institute for AI(艾伦人工智能研究所,由微软联合创始人保罗·艾伦发起成立,长期聚焦通用AI、机器人学习等领域的前沿研究)正式发布面向机器人操作场景的eval_cosmos_cup_stacking_ood数据集,首发上线于全球最大的AI模型数据集平台Hugging Face,主要面向机器人灵巧操作、模仿学习领域的研发需求。

本次发布的数据集基于Hugging Face开源机器人学习工具链LeRobot构建,是专门针对双机械臂操作场景采集的标注数据集,底层采集依托bi_yam_follower双机械臂系统完成,覆盖2项堆叠杯相关操作任务,包含15个任务序列(episodes)、共16786帧有效标注数据,采集帧率为30fps。数据集整体采用轻量化存储方案:结构化标注数据以parquet格式存储,总大小约100MB,同步配套的多视角视频源文件总大小约200MB,当前仅开放训练分割(train)子集供研发人员使用。

该数据集的标注维度覆盖了机器人操作训练的全链路需求:核心动作标注为14维浮点数组,对应左右机械臂各6个关节的位置参数与2组夹爪位置参数;状态观测(observation.state)字段维度与动作参数完全对齐,可直接用于模仿学习的行为克隆、逆强化学习等算法训练;视觉观测维度同步采集了右、左、顶三个视角的实时视频流(对应observation.images.right/left/top字段),分辨率为360x640的3通道RGB格式,采用高压缩比的AV1编码,在降低存储成本的同时保留了足够的视觉特征信息。此外,数据集还配套了时间戳、帧索引、episode索引、全局索引和任务索引等辅助字段,方便研发人员根据需求灵活切分、调用数据。该数据集采用Apache 2.0开源许可证,支持学术研究与商业化开发场景免费使用,大幅降低了相关研发的准入门槛。

从应用价值来看,该数据集可广泛支撑多个方向的研发需求:学术研究层面,可用于机器人灵巧操作的分布外泛化算法验证、多视角视觉-动作对齐模型训练、Sim2Real(仿真到真实)迁移效果测试等场景;产业落地层面,可为工业协作机器人的小件装配、物料分拣,服务机器人的桌面操作、家务任务执行,人形机器人的手部精细动作迭代等场景提供训练数据源支撑,是机器人领域核心的基础设施级数据资源。

查看eval_cosmos_cup_stacking_ood

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们