five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

maeste发布record-v5机器人多模态数据集 赋能运动控制与视觉模仿学习研发

五号数据雷达开源数据市场2026-05-25 01:468
科技厂商maeste于2026年5月24日在全球AI开源社区HuggingFace首发record-v5机器人专项数据集,覆盖多维度动作、状态、视觉标注数据,可为机器人运动控制、视觉模仿学习等方向的研发提供核心数据支撑。

当前具身智能与通用机器人技术正进入快速落地期,高标注精度、多模态融合的专项训练数据集,已成为机器人运动控制算法优化、视觉模仿学习模型迭代的核心基础资源。近日,科技厂商maeste正式对外发布record-v5_20260524_090958机器人专项数据集,该产品已于2026年5月24日率先在全球最大的AI开源社区HuggingFace上线,面向全球研发团队开放使用。

本次发布的record-v5数据集是面向机器人技术研发的专用训练数据集,基于全球主流的机器人训练数据构建框架LeRobot创建,面向so_follower型机器人的训练场景优化设计,当前仅开放训练集切片,共包含40组采集序列,总帧数达25311帧,采集帧率为30fps,整体数据规模适中,可满足小样本微调、算法验证等多类研发需求。

在数据结构设计上,该数据集覆盖动作、状态、视觉三大维度的标注信息:动作特征维度覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置共6类核心关节运动参数;观测状态特征与动作特征维度一一对应,可用于训练机器人运动过程中的状态闭环校验能力;视觉维度则同步采集了前视、腕部、右侧三个机位的实时视频流,视频分辨率为480x640、3通道色彩,可支撑多视角视觉模仿学习模型的训练需求。存储层面,该数据集的结构化标注数据采用parquet格式存储,具备高压缩比、快速读写的特性,可降低研发团队的数据预处理成本;视频文件采用通用mp4格式封装,整体结构化数据文件大小为100MB,视频文件总大小为200MB,下载与部署门槛较低。

从应用价值来看,该数据集可广泛覆盖机器人领域的多个研发场景:在工业机器人场景中,可用于训练机械臂的精细抓取、柔性装配等动作的运动控制算法,提升工业机器人的操作精度与响应速度;在具身智能人形机器人场景中,多视角视觉数据与动作标注的匹配,可支撑视觉模仿学习模型训练,帮助机器人通过视觉输入直接复刻人类的操作动作;此外该数据集还可用于机器人仿真环境的参数校准、小样本学习算法验证等研发环节。业内人士指出,当前国内机器人数据集市场仍存在细分场景覆盖不足、标注精度参差不齐、多模态数据匹配度低等问题,本次maeste发布的专项数据集,进一步丰富了机器人运动控制、视觉模仿学习方向的开源数据供给,对降低中小研发团队的技术研发门槛,推动具身智能技术落地具备积极作用。

查看record-v5_20260524_090958

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们