随着具身智能产业进入落地爆发期,工业机器人、服务机器人的操控算法迭代对高质量实机操作数据集的需求持续攀升,但当前面向双臂协同、细分任务场景的结构化标注数据集供给仍存在明显缺口,成为制约中小团队研发落地的核心瓶颈之一。近日,数据贡献方kmg0620正式在HuggingFace平台首发pick_battery机器人操作数据集,为机械臂操控学习、具身智能多模态模型训练提供了高质量的垂直场景数据供给。
据介绍,pick_battery数据集依托LeRobot框架创建,作为定向针对电池抓取单一任务的机器人操作数据集,所有数据均采集自bi_so_follower双手机器人系统,累计包含185个训练集、共137264帧采集数据,采集帧率为30fps,可完整还原双臂完成抓取任务的全流程动作细节。
在数据维度设计上,该数据集覆盖了机器人操作训练所需的全链路数据类型:其一为动作特征数据,包含12个浮点数值,对应左右机械臂的肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕滚动、夹爪位置共6类关节位置参数;其二为状态观测数据,与动作特征的12个关节位置参数完全对齐,可支撑算法对动作执行效果的校验训练;其三为图像观测数据,包含左主摄像头、右腕摄像头两个视角的RGB视频,分辨率为240x320,采用H264编码,可满足多模态视觉-动作联合训练需求;此外还配套有时间戳、帧索引、集索引等完整元数据,方便研发人员按需调用切片。
存储层面,该数据集的结构化数据采用parquet格式存储,视频文件采用mp4格式存储,其中结构化数据文件总大小为100MB,视频文件总大小为200MB,整体体积轻巧,即便算力资源有限的中小团队、个人开发者也可快速加载部署,大幅降低了训练门槛。
从应用价值来看,pick_battery数据集可广泛支撑多个机器人领域的研发需求:在工业场景中,可用于3C电子制造生产线的电池分拣、装配环节的机械臂操控算法训练,优化双臂协同操作的路径规划与力控精度;在具身智能研发领域,同步覆盖视觉数据与关节状态数据的设计,可支撑视觉-动作端到端模型的训练,以及仿真环境到真实场景迁移(Sim2Real)的效果验证;此外,该数据集的标准化采集框架也可为后续机器人操作数据集的采集、标注规范提供参考样本。
当前,我国数据要素市场建设持续推进,面向人工智能训练的垂直场景数据集是AI产业的核心基础设施,本次pick_battery数据集的发布,不仅填补了双臂电池抓取细分场景的数据集供给缺口,也为降低具身智能研发门槛、加速机器人操控技术落地提供了重要的数据支撑,对推动具身智能产业的普惠化发展具有积极意义。





_1769672084863.jpg)