five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

艾伦人工智能研究所发布双机械臂糖果分拣OOD数据集 赋能具身智能视觉运动控制研发

五号数据雷达开源数据市场2026-05-21 04:286
2026年5月20日,艾伦人工智能研究所(Allen Institute for AI)在Hugging Face首发开源数据集eval_pi05_candy_sorting_ood,面向双机械臂操作、机器人视觉运动控制研究场景,为具身智能领域的模仿学习、跨分布泛化等前沿方向提供标准化训练评估基准。

近年具身智能已成为AI落地实体产业的核心赛道,双机械臂操作作为工业柔性生产、高端自动化的核心技术,其研发高度依赖高质量、多场景的多模态演示数据集。但当前开源领域面向跨分布(OOD)场景的双机械臂专业数据集供给严重不足,多数现有数据集仅覆盖单一固定环境,无法支撑模型在复杂真实场景下的泛化能力训练。在此背景下,艾伦人工智能研究所(Allen Institute for AI,简称AI2,由微软联合创始人保罗·艾伦创立的前沿AI研究机构)正式发布eval_pi05_candy_sorting_ood数据集,填补了该细分领域的开源数据缺口。

该数据集基于LeRobot工具构建,采用对商业应用友好的Apache-2.0开源许可证,学术机构、企业研发团队均可免费使用并进行二次开发。其核心内容为"bi_yam_follower"双机械臂的糖果分拣任务演示数据,设计初衷就是为模仿学习、视觉运动策略学习、跨分布泛化测试等前沿研究提供标准化的训练与评估基准。

数据维度方面,eval_pi05_candy_sorting_ood共包含24条完整操作轨迹(episodes),累计15757个时间步(帧),覆盖4种不同的分拣任务设定。整体采用多模态结构组织:1) 动作空间:涵盖左右机械臂各6个关节的位置指令、以及左右夹爪的位置指令,共计14维浮点数向量,可精准还原机械臂操作的全链路动作逻辑;2) 观测空间:除了对应动作空间的14维机械臂关节状态数据外,还同步收录了右、左、顶三个固定视角的RGB视频流,单帧分辨率为360x640,采用30fps帧率录制、AV1编码,可模拟不同部署位置的工业视觉设备采集的真实画面。此外,数据集还配套了时间戳、帧索引、轨迹索引、任务索引等完整元数据,采用分块Parquet文件格式存储,同时配有独立的MP4视频文件,方便研发团队按需调用不同模态的数据。

从应用价值来看,该数据集可广泛用于训练和评估基于视觉的双机械臂控制模型,除了基础的糖果分拣任务外,其多模态、跨场景的设计还可支撑工业小零件分拣、食品加工物料分类、实验室精密组装等多个场景的具身智能模型研发,尤其是其OOD(跨分布)的数据集设定,可有效测试模型在未见过的物料形态、摆放位置、光照环境下的操作准确率,更贴近真实生产环境的需求,对降低具身智能研发门槛、推动双机械臂技术落地具有重要意义。

查看eval_pi05_candy_sorting_ood

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们