five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

TheMuz发布多模态机器人操作数据集 首发HuggingFace 赋能机器人控制与多模态行为学习研发

五号数据雷达开源数据市场2026-05-07 23:598
人工智能技术机构TheMuz于2026年5月7日在HuggingFace首发多模态机器人操作数据集rollout_kirby_dagger_v2_iter1_combined,该数据集基于LeRobot框架构建,覆盖机器人关节状态、双视角视觉等多维度结构化特征,可为机器人控制算法迭代、多模态行为学习模型训练提供标准化训练数据源。

当前具身智能与服务机器人产业正处于技术落地关键期,多模态实机操作数据是支撑机器人控制算法迭代、多模态行为学习模型训练的核心生产要素。由于实机数据采集成本高、标注标准化难度大,高质量的公开数据集长期是行业稀缺资源,直接制约了中小研发团队的技术迭代效率。近日,人工智能技术研发方TheMuz正式在HuggingFace首发多模态机器人操作数据集rollout_kirby_dagger_v2_iter1_combined,为相关领域研发提供了新的标准化数据供给。

该数据集基于LeRobot框架创建,核心围绕机器人操作场景采集多维度特征数据,整体结构完善,字段覆盖机器人动作数据、观察状态(关节位置)、顶部+正面双视角图像(分辨率480x640、帧率30fps)、干预标记、时间戳、帧索引、剧集索引等核心维度。本次公开的数据集共包含20个剧集,总计12154帧数据,对应1个机器人操作任务,其中结构化数据文件大小为100MB,配套视频文件大小为200MB,采集所用机器人型号为so_follower,数据集采用apache-2.0开源许可证。

从应用价值来看,该数据集的多模态结构化特征可支撑多个细分研发场景:研发团队可基于双视角视觉数据与关节状态的对应关系,训练多模态输入的机器人模仿学习模型,提升机器人操作任务的决策准确率;干预标记、时间戳等字段可用于机器人控制算法的误差校准,降低实机测试阶段的安全风险;标准化的数据集结构也可支撑不同研发团队的算法效果横向对比,推动行业研发评估标准的统一。同时apache-2.0许可证允许使用者自由修改、分发甚至商用,可大幅降低具身智能研发团队的数据集获取门槛,对于推动数据要素在人工智能细分领域的高效流通、降低全行业研发成本具有积极意义。

查看rollout_kirby_dagger_v2_iter1_combined

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们