five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

seriintan发布机器人领域多模态数据集eval_spatialPE_v6_crossattn 赋能运动控制与视觉感知技术研发

五号数据雷达开源数据市场2026-05-10 23:2716
AI领域开发者seriintan于2026年5月10日在全球知名AI开源社区HuggingFace首发机器人专用数据集eval_spatialPE_v6_crossattn,该数据集覆盖机器人关节状态、多视角视觉等多维度标注数据,可为机器人运动控制、视觉感知算法的训练与验证提供标准化数据支撑。

当前,全球机器人产业正处于高速发展期,无论是工业机械臂的精细作业升级、服务机器人的场景落地,还是人形机器人的核心技术突破,都高度依赖高质量、多模态的标注数据集作为算法训练底座。但长期以来,机器人垂直领域的公开数据集普遍存在模态单一、标注维度不足、场景覆盖有限等问题,大幅抬高了中小研发团队的技术研发门槛,也制约了行业通用算法的标准化迭代。

seriintan本次发布的eval_spatialPE_v6_crossattn,是基于LeRobot工具构建的机器人领域专用数据集,共包含24个序列样本(episodes)、4364帧标注数据。数据集覆盖多类核心特征维度:既包含机器人的动作数据(6个关节位置)、观察状态数据(6个关节位置)等本体运动参数,也包含分辨率为480x640的前视、侧视双视角视频图像数据,以及配套的时间戳、帧索引等结构化信息。数据文件采用parquet格式存储,视频文件采用通用mp4格式存储,总数据量约300MB,其中结构化数据占100MB、视频数据占200MB,便于不同技术栈的研发团队快速调用。

从应用场景来看,该数据集的多模态属性可适配机器人领域多类核心研发需求:可用于工业机械臂的路径规划算法验证,对比关节控制指令与实际运动状态的匹配度,提升精细操作精度;可用于服务机器人、人形机器人的动态避障模型训练,基于双视角视觉数据构建环境感知能力,结合关节状态数据优化运动决策逻辑;也可用于多模态大模型在机器人端的落地测试,支撑“视觉输入-决策输出-运动控制”全链路算法的迭代优化。

作为垂直领域的优质公开数据集,eval_spatialPE_v6_crossattn的发布进一步丰富了全球机器人领域的公开数据供给,有效降低研发团队的原始数据采集与标注成本,对于推动机器人运动控制、视觉感知相关技术的标准化验证与快速落地,完善AI机器人产业的数据要素供给体系具有积极意义。

查看eval_spatialPE_v6_crossattn

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们