首页 / 开源数据市场 / 正文

maeste发布record-v5机器人多模态数据集赋能运动控制与视觉模仿学习研发

五号数据雷达开源数据市场2026-05-25 01:468

科技厂商maeste于2026年5月24日在全球AI开源社区HuggingFace首发record-v5机器人专项数据集，覆盖多维度动作、状态、视觉标注数据，可为机器人运动控制、视觉模仿学习等方向的研发提供核心数据支撑。

当前具身智能与通用机器人技术正进入快速落地期，高标注精度、多模态融合的专项训练数据集，已成为机器人运动控制算法优化、视觉模仿学习模型迭代的核心基础资源。近日，科技厂商maeste正式对外发布record-v5_20260524_090958机器人专项数据集，该产品已于2026年5月24日率先在全球最大的AI开源社区HuggingFace上线，面向全球研发团队开放使用。

本次发布的record-v5数据集是面向机器人技术研发的专用训练数据集，基于全球主流的机器人训练数据构建框架LeRobot创建，面向so_follower型机器人的训练场景优化设计，当前仅开放训练集切片，共包含40组采集序列，总帧数达25311帧，采集帧率为30fps，整体数据规模适中，可满足小样本微调、算法验证等多类研发需求。

在数据结构设计上，该数据集覆盖动作、状态、视觉三大维度的标注信息：动作特征维度覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置共6类核心关节运动参数；观测状态特征与动作特征维度一一对应，可用于训练机器人运动过程中的状态闭环校验能力；视觉维度则同步采集了前视、腕部、右侧三个机位的实时视频流，视频分辨率为480x640、3通道色彩，可支撑多视角视觉模仿学习模型的训练需求。存储层面，该数据集的结构化标注数据采用parquet格式存储，具备高压缩比、快速读写的特性，可降低研发团队的数据预处理成本；视频文件采用通用mp4格式封装，整体结构化数据文件大小为100MB，视频文件总大小为200MB，下载与部署门槛较低。

从应用价值来看，该数据集可广泛覆盖机器人领域的多个研发场景：在工业机器人场景中，可用于训练机械臂的精细抓取、柔性装配等动作的运动控制算法，提升工业机器人的操作精度与响应速度；在具身智能人形机器人场景中，多视角视觉数据与动作标注的匹配，可支撑视觉模仿学习模型训练，帮助机器人通过视觉输入直接复刻人类的操作动作；此外该数据集还可用于机器人仿真环境的参数校准、小样本学习算法验证等研发环节。业内人士指出，当前国内机器人数据集市场仍存在细分场景覆盖不足、标注精度参差不齐、多模态数据匹配度低等问题，本次maeste发布的专项数据集，进一步丰富了机器人运动控制、视觉模仿学习方向的开源数据供给，对降低中小研发团队的技术研发门槛，推动具身智能技术落地具备积极作用。

查看record-v5_20260524_090958

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

maeste发布record-v5机器人多模态数据集 赋能运动控制与视觉模仿学习研发

Dataset card内容：

Files and versions内容：

社区讨论

maeste发布record-v5机器人多模态数据集赋能运动控制与视觉模仿学习研发