当前具身智能正处于技术落地的关键窗口期,双手机器人作为工业生产、生活服务场景下的核心具身载体,其模仿学习、协同控制能力的迭代高度依赖高质量标注数据集的支撑,但行业内聚焦细分操作任务、覆盖多维度感知与动作标注的开源数据集供给仍相对不足。近日,开发者kawamura101010正式发布双手机器人专项数据集ki_task_4_1,并于2026年5月11日首发于全球最大的AI开源社区HuggingFace,为相关领域的技术研究提供了全新的标准化数据素材。
据公开信息显示,ki_task_4_1是基于机器人研究工具LeRobot构建的专项数据集,专门面向机器人技术研究场景设计。该数据集覆盖1项完整双手机器人操作任务,包含1个完整任务序列(episode)、共3094帧标注数据,结构化数据以parquet文件格式存储,总大小为100MB,配套视频文件总大小为200MB,数据采样帧率为30fps,已完成训练集划分,可直接适配主流深度学习模型的训练需求。
从标注维度来看,该数据集的核心特征分为动作(action)和观察(observation)两大模块:其中动作维度由12个浮点数组成,精准对应左右机械臂的12个关节位置,覆盖左肩平移、左肩提升、左肘弯曲等全维度动作参数,完整还原了双手机器人操作过程中的动作逻辑;观察维度除了包含与动作模块对应的12个关节位置状态数据外,还同步采集了三个视角的RGB视频数据,分别为全局左前视角、左腕视角、右腕视角,单帧图像分辨率为360x640,采用h264编码无音频存储,可满足多视角视觉感知研究的需求。此外,数据集还配套了时间戳、帧索引、episode索引、任务索引等完整元数据,方便研究人员按需调用、二次加工,降低数据预处理环节的工作量。
从应用方向来看,ki_task_4_1可广泛应用于双手机器人控制、模仿学习、计算机视觉等多个研究领域:在模仿学习场景下,研究人员可基于该数据集的动作-感知对应标注,训练双手机器人复现精细操作任务,大幅降低实体数据采集的成本与门槛,加速小样本场景下的模型迭代效率;在机器人控制领域,该数据集的全关节位置标注可用于验证双机械臂协同控制算法的精度,优化动作规划逻辑,缩小模拟运行与实体落地的效果差距;在计算机视觉方向,多视角的视觉采集数据可支撑视觉伺服、动态目标识别、遮挡场景感知等算法的训练与优化,提升机器人操作过程中的环境适应性。作为开源数据集赛道的新增供给,ki_task_4_1也为具身智能领域的标准化数据建设提供了参考范式,助力数据要素在具身智能产业中的价值释放。





_1769672084863.jpg)