当前,具身智能已成为人工智能领域的核心落地赛道,而多自由度机械臂的操作能力迭代,高度依赖标注完善、场景匹配的高质量实机运行数据。不过目前行业内公开的、同时覆盖关节运动数据与同步视觉观测数据的标准化数据集供给仍存在缺口,大量中小研发团队需要自行搭建测试环境采集数据,不仅拉高了研发成本,也导致不同算法模型之间缺乏统一的评估基准,制约了技术的迭代效率。针对这一行业痛点,robot-learning-group47本次发布的数据集eval1_60_fixed_banana_fixed_bowl,为相关领域研发提供了新的标准化数据选择。
该数据集是一个面向机器人学习场景的专用数据集,基于LeRobot工具创建——作为全球主流的机器人学习开源工具链,LeRobot支持数据集采集、模型训练、部署全流程,基于该工具生成的数据集具备良好的框架兼容性,可直接适配当前主流的机器人学习开发环境。本次发布的数据集包含60个完整任务执行片段(episodes),总计13246帧标注数据,涉及3个不同的机器人操作任务;结构化数据以parquet文件格式存储,配套视觉素材以mp4格式存储,兼顾了数据读取效率与跨平台兼容性。
数据集的标注维度覆盖机器人控制与学习所需的核心维度:动作(action)维度包含6个核心关节的位置数据,具体涵盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置;观测状态(observation.state)维度同样包含6个关节的实时运行位置数据;前摄像头图像(observation.images.front)分辨率为256x256,帧率为15fps,可支撑视觉感知类算法的训练需求;除此之外还配套了时间戳、帧索引、episode索引、索引和任务索引等完整元数据,可满足从模型训练到效果评估的全流程数据需求,适用于各类机器人控制和学习任务。
从应用场景来看,该数据集可广泛支撑机器人关节控制、视觉伺服操作等领域的研发工作:在关节控制场景下,研发人员可基于该数据集训练多自由度机械臂的轨迹规划算法、力控调整模型,提升机械臂执行复杂动作的精度和稳定性;在视觉伺服场景下,同步的视觉输入与关节状态数据,可支撑“视觉感知-动作输出”端到端模型的训练,优化机械臂基于实时视觉反馈调整操作路径的能力;除此之外,该数据集还可作为通用基准,用于不同机器人学习模型的效果对比,降低研发团队的自建测试集成本。作为具身智能产业的核心生产要素,高质量公开数据集的持续供给,是推动机器人学习技术从实验室走向商业化落地的重要基础,本次数据集的发布也进一步丰富了机器人学习领域的公开数据资源池,为中小团队参与具身智能研发降低了门槛。
查看eval1_60_fixed_banana_fixed_bowl





_1769672084863.jpg)