five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

艾伦人工智能研究所发布eval_pi05_test_tube_ood多模态数据集 赋能机器人模仿学习与控制领域研究

五号数据雷达开源数据市场2026-05-21 20:458
全球顶尖AI研究机构艾伦人工智能研究所于2026年5月20日在Hugging Face平台首发多模态机器人数据集eval_pi05_test_tube_ood,该数据集基于LeRobot框架构建,可为机器人模仿学习、多模态感知控制、强化学习等方向的前沿研究提供标准化训练数据支撑。

当前,人形机器人、工业协作机器人的商业化落地进程不断加快,模仿学习、多模态感知控制作为机器人智能升级的核心技术路径,长期面临高质量标注训练数据供给不足、场景覆盖有限、数据集标准化程度偏低等行业痛点,专业级垂直数据集已成为机器人学习领域的核心研发基础设施。全球顶尖非营利性AI研究机构艾伦人工智能研究所(Allen Institute for AI,简称AI2,由微软联合创始人保罗·艾伦发起成立,长期聚焦通用人工智能、机器人学习等前沿领域基础研究)于2026年5月20日在Hugging Face平台首发全新多模态机器人数据集eval_pi05_test_tube_ood,专门面向机器人学习任务设计。

本次发布的数据集基于全球机器人学习领域广泛应用的开源工具链LeRobot框架构建,具备良好的跨平台兼容性,可直接对接主流机器人仿真平台、实体机器人控制接口,大幅降低研究团队的数据适配成本。数据集共包含25个完整操作序列(episodes),总计13698帧标注数据,覆盖3类不同的机器人操作任务,采用多模态混合存储形式:其中结构化数据以高压缩率的Parquet格式存储,总容量约100MB,包含机器人的动作指令、关节状态观测、任务属性元数据等核心标注内容;同步配套多视角视频文件总容量约200MB,采用AV1编码、30fps帧率的MP4格式存储,保障高画质的同时降低存储与传输成本。

从核心数据特征来看,该数据集覆盖14维动作空间(可支撑左右机械臂各6个关节、2组夹爪的位置控制训练)、14维的状态观测空间(与动作空间一一对应,可用于控制效果的闭环验证),同时提供右、左、顶部三个固定视角的RGB视觉观测数据,单视频帧分辨率为360x640,可满足多模态感知融合算法的训练需求。此外,数据集还完整记录了时间戳、帧索引、episode索引、任务索引等全链路元信息,方便研究人员按需拆分、组合训练样本。目前该数据集仅开放训练集划分,可供全球研究团队免费下载使用。

从应用场景来看,该数据集可广泛支撑多个前沿研究方向:在机器人模仿学习领域,研究人员可基于标注的完整操作序列,训练机器人复现精细操作流程,验证小样本学习场景下的操作泛化能力;在多模态机器人控制领域,结合视觉观测与关节状态数据,可测试多模态感知融合算法的控制精度、响应延迟与动态场景鲁棒性;此外还可用于强化学习算法的仿真预训练、机器人视觉定位与操作匹配算法验证、跨平台机器人控制模型迁移测试等研究场景。

作为机器人学习领域的新增标准化数据集供给,本次eval_pi05_test_tube_ood的发布,进一步降低了相关领域的研究门槛,对于加快机器人智能控制技术的迭代落地、推动多模态大模型与实体机器人的技术融合、完善全球机器人开源数据生态具有重要意义。

查看eval_pi05_test_tube_ood

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们