five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Maeste发布Record-V3多模态机器人数据集 首发HuggingFace 支撑模仿学习与多模态控制研发

五号数据雷达开源数据市场2026-05-24 00:296
机器人技术服务商Maeste于2026年5月23日在HuggingFace平台首发由LeRobot创建的Record-V3多模态机器人数据集,涵盖关节状态、多视角视觉等多维度标注数据,采用Apache 2.0开源协议,可为机器人模仿学习、多模态控制领域的算法研发提供高质量训练数据源。

当前全球机器人产业正处于从自动化向智能化迭代的关键周期,模仿学习、多模态融合控制作为实现机器人自适应作业的核心技术路径,对高标注质量、多模态融合的场景训练数据集需求持续攀升,优质数据集已成为推动机器人算法落地的核心基础设施。近日,机器人技术服务商Maeste正式发布record-v3_20260523_124101数据集,该数据集由LeRobot打造,面向机器人学研发场景开放,本次为2026年5月23日首次在HuggingFace平台上线,核心覆盖机器人模仿学习、多模态机器人控制两大核心应用方向。

本次发布的数据集共收录40个完整作业回合,累计17646帧采样数据,采样帧率达30fps,可完整还原机器人作业的连续动作序列。数据维度包含两大核心类别:一类是结构化状态数据,其中动作(action)与观测状态(observation.state)均为6维浮点数组,分别对应机器人肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置六大核心关节的位置参数,可直接用于机器人动作序列的模型训练;另一类是非结构化视觉数据,覆盖前视、腕部、右侧三个作业核心视角,均采用AV1编码的30fps视频格式存储,分辨率为480x640,可支撑多视角视觉感知与动作匹配的算法研发。此外数据集还包含时间戳、帧索引、回合索引、任务索引等配套标注字段,方便研发人员快速定位与筛选对应场景数据。

本次发布的数据集采用Apache 2.0开源许可证,支持商业与非商业场景的二次开发,适配so_follower类型机器人的训练需求;数据主体采用Parquet格式存储,视频文件为通用MP4格式,总数据大小约300MB,全量训练集覆盖所有40个作业回合,轻量化的存储结构可大幅降低研发团队的数据加载与预处理成本。

从行业应用价值来看,该数据集的多模态融合属性可支撑多个典型研发场景:在机器人模仿学习领域,研发人员可基于关节状态数据与对应视角的视觉数据的匹配关系,训练算法学习标准化作业流程,完成工业装配、物料分拣、服务机器人日常操作等场景的动作复刻;在多模态机器人控制领域,该数据集可用于训练模型融合视觉感知信息与关节状态反馈,实现复杂场景下的动作动态调整,提升机器人作业的自适应能力与容错率。本次数据集的开放,也进一步丰富了全球机器人研发领域的高质量开源数据供给,为机器人智能化技术落地提供了基础支撑。

查看record-v3_20260523_124101

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们