当前具身智能、人形机器人赛道正处于技术落地的关键阶段,高质量、多模态的实采训练数据,是支撑机器人控制算法迭代、动作捕捉精度提升的核心生产要素,也是行业普遍面临的供给短板。近日,开发者jogarulfo正式对外发布eval_dataset_MVP_store_cardboardv3数据集,该数据集于2026年5月2日首发于全球最大的AI模型与数据集共享平台HuggingFace,主要面向机器人控制、动作捕捉领域的训练与验证需求。
据公开信息显示,该数据集为LeRobot系列机器人专项数据集,LeRobot是全球知名的机器人领域开源数据集项目,专注于输出标注完善、模态匹配的机器人实采训练数据。本次发布的数据集核心覆盖机器人任务执行过程中的动作与观测全链路数据,共包含2个任务剧集(episodes)、2260帧有效采样数据,对应1项机器人操作任务。其数据维度覆盖四大类:第一类为机械臂动作指令数据,包含肩部旋转关节(shoulder_pan.pos)、肩部抬升关节(shoulder_lift.pos)、肘部弯曲关节(elbow_flex.pos)、腕部弯曲关节(wrist_flex.pos)、腕部旋转关节(wrist_roll.pos)、夹爪(gripper.pos)共6个核心关节的位置参数,完整覆盖机械臂作业的全运动链路;第二类为状态观测数据,同步采集与动作指令对应的6个关节实际运行位置,可用于动作执行偏差校验、控制算法精度评估;第三类为视觉观测数据,同步收录机械臂手腕端第一视角、作业场景全局顶视视角的两路视频流,分辨率为480x640、帧率30fps,可支撑多模态视觉伺服算法的训练;第四类为时间戳、帧索引、剧集索引等结构化元数据,方便训练过程中的数据对齐与片段检索。
存储层面,该数据集结构化数据采用AI训练场景通用的parquet列式存储格式,具备压缩率高、读取速度快、适配主流训练框架的优势,结构化数据文件总大小为100MB,配套视频文件总大小为200MB,整体轻量化的特征适合算法原型快速验证、小样本学习场景使用。
从应用价值来看,该数据集可广泛应用于多个机器人相关场景:在机械臂控制领域,可用于轨迹规划、力控算法的训练与精度验证,提升机械臂执行抓取、搬运等工业级任务的稳定性;在动作捕捉领域,可作为人体动作向机器人关节参数迁移的基准数据集,优化动作复刻的匹配度;在多模态融合算法研究领域,同步覆盖关节运动数据与双视角视觉数据的特征,也可为视觉伺服、环境感知等方向的模型训练提供数据支撑。
查看eval_dataset_MVP_store_cardboardv3
Dataset card内容:
Files and versions内容:
业内分析指出,当前全球数据要素市场中,垂直领域的高质量训练数据集供给仍存在明显缺口,该类机器人专项多模态数据集的开源发布,将有效降低中小研发团队、高校科研机构的数据集获取成本,为机器人控制、动作捕捉领域的技术迭代提供基础支撑,进一步推动具身智能产业的创新落地。





_1769672084863.jpg)