当前具身智能与服务机器人产业正处于技术落地关键期,多模态实机操作数据是支撑机器人控制算法迭代、多模态行为学习模型训练的核心生产要素。由于实机数据采集成本高、标注标准化难度大,高质量的公开数据集长期是行业稀缺资源,直接制约了中小研发团队的技术迭代效率。近日,人工智能技术研发方TheMuz正式在HuggingFace首发多模态机器人操作数据集rollout_kirby_dagger_v2_iter1_combined,为相关领域研发提供了新的标准化数据供给。
该数据集基于LeRobot框架创建,核心围绕机器人操作场景采集多维度特征数据,整体结构完善,字段覆盖机器人动作数据、观察状态(关节位置)、顶部+正面双视角图像(分辨率480x640、帧率30fps)、干预标记、时间戳、帧索引、剧集索引等核心维度。本次公开的数据集共包含20个剧集,总计12154帧数据,对应1个机器人操作任务,其中结构化数据文件大小为100MB,配套视频文件大小为200MB,采集所用机器人型号为so_follower,数据集采用apache-2.0开源许可证。
从应用价值来看,该数据集的多模态结构化特征可支撑多个细分研发场景:研发团队可基于双视角视觉数据与关节状态的对应关系,训练多模态输入的机器人模仿学习模型,提升机器人操作任务的决策准确率;干预标记、时间戳等字段可用于机器人控制算法的误差校准,降低实机测试阶段的安全风险;标准化的数据集结构也可支撑不同研发团队的算法效果横向对比,推动行业研发评估标准的统一。同时apache-2.0许可证允许使用者自由修改、分发甚至商用,可大幅降低具身智能研发团队的数据集获取门槛,对于推动数据要素在人工智能细分领域的高效流通、降低全行业研发成本具有积极意义。
查看rollout_kirby_dagger_v2_iter1_combined





_1769672084863.jpg)