five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

艾伦AI研究所发布eval_xvla_pipette_in-distribution数据集 为双臂机器人精密操作训练提供开源数据支撑

五号数据雷达开源数据市场2026-05-21 19:577
全球知名AI研究机构艾伦人工智能研究所(Allen Institute for AI)于2026年5月20日在HuggingFace首发机器人领域专用数据集eval_xvla_pipette_in-distribution,该数据集基于LeRobot框架构建,覆盖双臂机器人移液操作全流程交互数据,可直接支撑机器人控制、模仿学习、强化学习等研发需求,助力精密操作类机器人的技术落地。

当前,全球精密操作机器人赛道正处于快速落地期,生物医药实验室自动化、工业精密组装等场景对双臂机器人的操作精度、稳定性要求持续提升,但面向细分任务的高质量标注交互数据稀缺,一直是制约模仿学习、强化学习类机器人算法迭代的核心瓶颈。作为全球顶尖的非营利性AI研究机构,艾伦人工智能研究所(Allen Institute for AI,简称AI2)长期聚焦人工智能基础技术与开源资源供给,其发布的各类数据集已成为全球AI研发领域的重要公共基础资源。

近日,AI2正式于2026年5月20日在HuggingFace平台首发全新机器人领域专用数据集eval_xvla_pipette_in-distribution,专门面向双臂机器人移液操作场景的模型训练需求设计。该数据集基于业内通用的LeRobot机器人学习框架创建,所有数据均采集自bi_yam_follower双臂机器人平台的真实交互过程,适用于机器人控制、模仿学习或强化学习等多类研发任务。

从数据集规格来看,本次发布的数据集总规模覆盖50个完整任务轨迹(episodes),共包含24471帧有效数据,采集帧率为30fps,完整还原了双臂机器人完成单次移液操作的全流程动作与环境反馈,且仅设置训练分割(train split),专门匹配分布内模型训练的使用需求。数据采用结构化特征形式存储,核心内容覆盖四大维度:1) 动作(action):14维浮点向量,分别对应左臂6个关节、1个夹爪与右臂6个关节、1个夹爪的位置控制指令,可精准复现操作过程中的每一步动作逻辑;2) 状态观测(observation.state):14维浮点向量,实时记录左右臂各关节和夹爪的当前位置状态,为算法训练提供精准的状态反馈基准;3) 图像观测(observation.images):包含右、左、顶三个视角的RGB视频流,单帧分辨率为360x640,采用AV1高效编码,完整覆盖操作场景的全局与局部环境信息,可支撑多模态机器人算法的训练需求;4) 元数据索引:包含时间戳、帧索引、episode索引、全局索引和任务索引,方便研发团队快速定位对应操作节点的数据,大幅降低数据预处理成本。

存储层面,该数据集的结构化数据采用Parquet格式存储,总大小约100MB;视频文件以MP4格式存储,总大小约200MB,整体轻量化的设计便于研发团队快速下载部署。此外,数据集采用Apache 2.0开源许可证,允许商业与非商业场景的自由使用,进一步降低了中小研发团队的使用门槛。

从应用价值来看,该数据集可广泛应用于多个机器人研发场景:一是双臂机器人的模仿学习训练,研发人员可直接基于该数据集训练移液操作模型,大幅减少真实机器人采样的时间与经济成本;二是精密操作类机器人的控制算法验证,可用于测试双臂协同控制的精度与稳定性;三是实验室自动化机器人的原型研发,为生物、化学实验室的自动化移液机器人研发提供标准化的训练基准。本次数据集的发布,进一步丰富了机器人细分操作场景的开源数据供给,对于推动数据要素在机器人研发领域的流通应用,加速精密操作机器人的商业化落地进程具有积极意义。

查看eval_xvla_pipette_in-distribution

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们