首页 / 开源数据市场 / 正文

艾伦人工智能研究所发布eval_pi05_test_tube_ood多模态数据集赋能机器人模仿学习与控制领域研究

五号数据雷达开源数据市场2026-05-21 20:458

全球顶尖AI研究机构艾伦人工智能研究所于2026年5月20日在Hugging Face平台首发多模态机器人数据集eval_pi05_test_tube_ood，该数据集基于LeRobot框架构建，可为机器人模仿学习、多模态感知控制、强化学习等方向的前沿研究提供标准化训练数据支撑。

当前，人形机器人、工业协作机器人的商业化落地进程不断加快，模仿学习、多模态感知控制作为机器人智能升级的核心技术路径，长期面临高质量标注训练数据供给不足、场景覆盖有限、数据集标准化程度偏低等行业痛点，专业级垂直数据集已成为机器人学习领域的核心研发基础设施。全球顶尖非营利性AI研究机构艾伦人工智能研究所（Allen Institute for AI，简称AI2，由微软联合创始人保罗·艾伦发起成立，长期聚焦通用人工智能、机器人学习等前沿领域基础研究）于2026年5月20日在Hugging Face平台首发全新多模态机器人数据集eval_pi05_test_tube_ood，专门面向机器人学习任务设计。

本次发布的数据集基于全球机器人学习领域广泛应用的开源工具链LeRobot框架构建，具备良好的跨平台兼容性，可直接对接主流机器人仿真平台、实体机器人控制接口，大幅降低研究团队的数据适配成本。数据集共包含25个完整操作序列（episodes），总计13698帧标注数据，覆盖3类不同的机器人操作任务，采用多模态混合存储形式：其中结构化数据以高压缩率的Parquet格式存储，总容量约100MB，包含机器人的动作指令、关节状态观测、任务属性元数据等核心标注内容；同步配套多视角视频文件总容量约200MB，采用AV1编码、30fps帧率的MP4格式存储，保障高画质的同时降低存储与传输成本。

从核心数据特征来看，该数据集覆盖14维动作空间（可支撑左右机械臂各6个关节、2组夹爪的位置控制训练）、14维的状态观测空间（与动作空间一一对应，可用于控制效果的闭环验证），同时提供右、左、顶部三个固定视角的RGB视觉观测数据，单视频帧分辨率为360x640，可满足多模态感知融合算法的训练需求。此外，数据集还完整记录了时间戳、帧索引、episode索引、任务索引等全链路元信息，方便研究人员按需拆分、组合训练样本。目前该数据集仅开放训练集划分，可供全球研究团队免费下载使用。

从应用场景来看，该数据集可广泛支撑多个前沿研究方向：在机器人模仿学习领域，研究人员可基于标注的完整操作序列，训练机器人复现精细操作流程，验证小样本学习场景下的操作泛化能力；在多模态机器人控制领域，结合视觉观测与关节状态数据，可测试多模态感知融合算法的控制精度、响应延迟与动态场景鲁棒性；此外还可用于强化学习算法的仿真预训练、机器人视觉定位与操作匹配算法验证、跨平台机器人控制模型迁移测试等研究场景。

作为机器人学习领域的新增标准化数据集供给，本次eval_pi05_test_tube_ood的发布，进一步降低了相关领域的研究门槛，对于加快机器人智能控制技术的迭代落地、推动多模态大模型与实体机器人的技术融合、完善全球机器人开源数据生态具有重要意义。

查看eval_pi05_test_tube_ood

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

艾伦人工智能研究所发布eval_pi05_test_tube_ood多模态数据集 赋能机器人模仿学习与控制领域研究

Dataset card内容：

Files and versions内容：

社区讨论

艾伦人工智能研究所发布eval_pi05_test_tube_ood多模态数据集赋能机器人模仿学习与控制领域研究