首页 / 开源数据市场 / 正文

Maeste发布Record-V3多模态机器人数据集首发HuggingFace 支撑模仿学习与多模态控制研发

五号数据雷达开源数据市场2026-05-24 00:296

机器人技术服务商Maeste于2026年5月23日在HuggingFace平台首发由LeRobot创建的Record-V3多模态机器人数据集，涵盖关节状态、多视角视觉等多维度标注数据，采用Apache 2.0开源协议，可为机器人模仿学习、多模态控制领域的算法研发提供高质量训练数据源。

当前全球机器人产业正处于从自动化向智能化迭代的关键周期，模仿学习、多模态融合控制作为实现机器人自适应作业的核心技术路径，对高标注质量、多模态融合的场景训练数据集需求持续攀升，优质数据集已成为推动机器人算法落地的核心基础设施。近日，机器人技术服务商Maeste正式发布record-v3_20260523_124101数据集，该数据集由LeRobot打造，面向机器人学研发场景开放，本次为2026年5月23日首次在HuggingFace平台上线，核心覆盖机器人模仿学习、多模态机器人控制两大核心应用方向。

本次发布的数据集共收录40个完整作业回合，累计17646帧采样数据，采样帧率达30fps，可完整还原机器人作业的连续动作序列。数据维度包含两大核心类别：一类是结构化状态数据，其中动作（action）与观测状态（observation.state）均为6维浮点数组，分别对应机器人肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置六大核心关节的位置参数，可直接用于机器人动作序列的模型训练；另一类是非结构化视觉数据，覆盖前视、腕部、右侧三个作业核心视角，均采用AV1编码的30fps视频格式存储，分辨率为480x640，可支撑多视角视觉感知与动作匹配的算法研发。此外数据集还包含时间戳、帧索引、回合索引、任务索引等配套标注字段，方便研发人员快速定位与筛选对应场景数据。

本次发布的数据集采用Apache 2.0开源许可证，支持商业与非商业场景的二次开发，适配so_follower类型机器人的训练需求；数据主体采用Parquet格式存储，视频文件为通用MP4格式，总数据大小约300MB，全量训练集覆盖所有40个作业回合，轻量化的存储结构可大幅降低研发团队的数据加载与预处理成本。

从行业应用价值来看，该数据集的多模态融合属性可支撑多个典型研发场景：在机器人模仿学习领域，研发人员可基于关节状态数据与对应视角的视觉数据的匹配关系，训练算法学习标准化作业流程，完成工业装配、物料分拣、服务机器人日常操作等场景的动作复刻；在多模态机器人控制领域，该数据集可用于训练模型融合视觉感知信息与关节状态反馈，实现复杂场景下的动作动态调整，提升机器人作业的自适应能力与容错率。本次数据集的开放，也进一步丰富了全球机器人研发领域的高质量开源数据供给，为机器人智能化技术落地提供了基础支撑。

查看record-v3_20260523_124101

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

Maeste发布Record-V3多模态机器人数据集 首发HuggingFace 支撑模仿学习与多模态控制研发

Dataset card内容：

Files and versions内容：

社区讨论

Maeste发布Record-V3多模态机器人数据集首发HuggingFace 支撑模仿学习与多模态控制研发