当前具身智能与工业机器人赛道正处于快速落地期,抓取、堆叠等基础操作能力是工业码垛、仓储分拣、家居服务等多个场景机器人落地的核心技术支撑,但行业长期面临标注完善、场景匹配的高质量多模态训练数据供给不足的痛点,制约了机器人操作模型的泛化能力与落地效率。
2026年5月12日,科技团队jisoo3正式发布game_block_stacking_ver4_h264数据集,并首发上线HuggingFace平台。该数据集基于HuggingFace旗下开源机器人学习工具链LeRobot创建,聚焦机器人游戏块堆叠细分场景,是专门面向机器人控制与学习任务研发的垂直领域训练数据集。
据公开信息显示,该数据集覆盖动作、观测两大维度的核心标注数据:动作维度收录了肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕滚动和夹爪位置共6个关节的位置数据;观测维度则包含同维度的6个关节实时状态数据,以及来自机器人前部摄像头、腕部摄像头的双视角视觉数据,图像分辨率为480x640、3通道,可完整还原机器人操作过程中的动作反馈与环境感知信息。数据集采用parquet文件格式存储结构化数据,同步配套帧率为30fps的MP4视频文件,所用采集机器人型号为omx_follower,整体结构按episode、帧、任务索引三级划分,标注规范清晰,可直接对接主流机器人学习模型的训练流程。
从应用价值来看,该数据集可支撑多个领域的研发需求:在工业机器人场景,可用于训练电子制造元器件堆叠、仓储货物码垛等场景的操作模型,提升抓取精度与堆叠稳定性;在服务机器人场景,可支撑家居物品整理、零售场景商品陈列等功能的算法优化;在具身智能通用模型研发领域,双视角视觉+关节运动的多模态数据结构,可帮助模型建立“动作执行-环境反馈”的闭环学习逻辑,提升模型在不同操作场景下的泛化能力。
作为垂直于机器人操作领域的标准化数据集,本次发布的game_block_stacking_ver4_h264进一步丰富了AI训练数据要素的供给结构,为机器人操作学习领域的研发提供了可复用的数据集范本,对推动具身智能技术落地、加快工业与服务机器人的场景化落地进程具有积极意义。
查看game_block_stacking_ver4_h264





_1769672084863.jpg)