当前具身智能产业正处于技术落地攻坚期,高质量实机操作数据集是训练机器人通用能力、降低研发成本的核心生产要素,其中双臂协作场景因动作复杂度高、多模态数据采集难度大,相关训练数据供给长期存在缺口。近日,开发者juyoungggg正式发布面向机器人任务的专用数据集0514_organize_Battery_3,为双臂机器人相关研发提供了标准化的训练素材支撑。
本次发布的0514_organize_Battery_3数据集基于Meta开源的LeRobot框架创建,该框架是目前全球机器人学习领域应用最广泛的工具链之一,可实现数据集采集、模型训练、实机部署的全流程打通,因此该数据集具备极强的生态兼容性,开发者可直接接入现有LeRobot训练pipeline开展研究。数据集共包含30个完整操作episodes,总计37834帧数据,结构化数据以parquet文件格式存储,视频素材以mp4格式存储,帧率为30fps,图像分辨率为480x640。
从数据维度来看,该数据集覆盖了动作、观测状态、视觉观测三类核心标注数据:动作维度包含12个关节位置参数,对应左右机械臂的肩部、肘部、腕部和夹爪位置;观测状态同步收录12个关节的实时位置数据;视觉观测则来自左腕、右腕、右顶部三个不同位置的摄像头,同时覆盖了臂端近距离操作细节与全局场景视角,可满足不同研发方向的数据需求。本次数据集采集对象为bi_so_follower型双臂机器人,整体标注质量符合工业级训练数据标准,适用于各类机器人控制和学习任务。
从应用价值来看,该数据集可广泛应用于双臂机器人控制、机器人视觉学习两大核心领域:在双臂机器人控制方向,数据集完整的动作-状态对应序列可用于训练双臂协同轨迹规划算法、精密操作力控算法,典型应用场景包括3C电子制造中的电池组装、精密零部件装配、实验室自动化样本处理等场景的机器人模型训练;在机器人视觉学习方向,多视角同步的图像数据搭配对应的关节状态标签,可支撑视觉伺服模型训练、操作场景语义识别、跨视角姿态估计等方向的研究,大幅降低研发团队的实机数据采集成本,缩短模型迭代周期。
业内人士指出,当前国内具身智能产业的训练数据供给仍以通用场景数据集为主,面向特定工业操作场景的高质量标注数据集缺口较大,本次0514_organize_Battery_3数据集的发布,不仅填补了双臂机器人操作细分场景的训练数据供给空白,也为学界、产业界的相关研究提供了标准化的基准测试素材,对推动双臂协作机器人在工业制造、智慧物流、科研服务等场景的商业化落地具备积极意义。





_1769672084863.jpg)