five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

seriintan发布机器人多模态数据集eval_act_spatialPE_v5_demo 覆盖机器人控制、多模态感知研发场景

五号数据雷达开源数据市场2026-05-07 23:3310
开源技术主体seriintan于2026年5月7日在全球AI开源社区HuggingFace首发eval_act_spatialPE_v5_demo数据集,基于LeRobot框架构建,覆盖机器人运动状态、多视角视觉等多维度对齐标注特征,可为机器人控制算法优化、多模态感知模型训练提供高质量标准化数据支撑。

近年来,全球智能机器人产业进入落地爆发期,工业柔性生产、商业服务、家用辅助等场景对机器人的环境适配能力、动作精准度要求持续提升,而多模态感知与运动控制作为机器人智能化的核心技术底座,其算法迭代高度依赖标注精准、模态对齐的高质量训练数据。当前机器人领域公开数据集普遍存在模态单一、运动与视觉数据未对齐、场景覆盖不足等问题,成为制约中小研发团队技术迭代的核心瓶颈之一。近日,开源技术主体seriintan正式对外发布机器人多模态数据集eval_act_spatialPE_v5_demo,该数据集于2026年5月7日首发于全球知名AI开源社区HuggingFace,主要面向机器人控制、多模态感知两大研发场景开放使用。

该数据集基于业内主流机器人AI研发工具LeRobot创建,符合通用机器人模型的训练数据标准,兼容性较强。数据集整体包含15个任务episodes,共4457帧有效数据,设定1个专项任务,结构化数据文件大小为100MB,配套视频文件大小为200MB,采样帧率为30fps,可满足时序性控制模型、多模态融合模型的训练帧密度要求。

从数据特征维度来看,该数据集覆盖了机器人运行全链路的核心标注维度:包含机器人6个关节的指令动作数据、对应时刻的6个关节实际运行状态数据,可直接用于机器人运动轨迹预测、关节力控优化、动作误差校准等算法的训练验证;同时配套分辨率为480x640的RGB三通道前视、侧视图像数据,搭配统一对齐的时间戳、帧索引、episode索引等结构化字段,实现了视觉感知信息与运动状态信息的精准时间对齐,为多模态融合感知模型的训练提供了标准化的高质量素材。存储层面,结构化数据采用parquet格式存储,可大幅提升大模型训练时的批量数据加载效率,降低研发团队的数据预处理成本;配套视频采用通用mp4格式存储,方便研发人员进行可视化校验、二次标注等拓展操作。

从应用价值来看,该数据集可广泛适配多类机器人研发场景:例如工业机器人的精细分拣、装配场景的控制算法训练,服务机器人的室内动态环境导航、避障感知模型迭代,人形机器人的基础动作复刻、人机交互场景的多模态理解研发等,能够有效降低相关研发团队的原始数据采集、标注成本,缩短技术迭代周期。作为机器人领域细分场景的公开数据集,本次eval_act_spatialPE_v5_demo的发布,也进一步丰富了全球开源机器人训练数据的供给池,对推动机器人领域AI技术的普惠化研发、加快数据要素在智能机器人产业的价值释放具有积极意义。

查看eval_act_spatialPE_v5_demo

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们