随着具身智能成为人工智能落地的核心赛道之一,高质量、标注完善的细分场景训练数据,已经成为制约机器人控制、视觉识别模型迭代的核心瓶颈。公开共享的标准化机器人操作数据集,能够大幅降低研发团队的前期数据采集与标注成本,加速技术落地效率。
近日,开发者martonbodo正式发布名为push-blue-triangle-good-24-48-hsv-sam-fill-outline的专用数据集,该数据集于2026年5月4日首发于HuggingFace平台,主要面向机器人操作控制、视觉任务执行领域的研发需求。
目前该数据集暂未提供官方公开描述,经对数据集结构与元数据的分析可以推断,这是一款基于LeRobot创建的机器人专项数据集。据了解,LeRobot是HuggingFace推出的开源机器人学习工具栈,专为具身智能模型的训练、数据集构建提供标准化工具支持,已成为全球机器人研发领域的主流底层工具之一。
martonbodo本次发布的数据集聚焦单一机器人操作任务,共包含24个采集片段、总计5825帧有效数据,采集帧率为30fps,覆盖so_follower类型机器人的完整动作与观测数据:核心数据维度包括关节位置(含shoulder_pan肩盘、shoulder_lift肩抬升、elbow_flex肘部弯曲、wrist_flex腕部弯曲、wrist_roll腕部旋转、gripper夹爪六大核心关节参数)、时间戳、帧索引、片段索引,同时配套eagle(鹰视俯瞰)和side(侧视)两种视角的图像观测数据。所有结构化数据以parquet格式存储,同时同步配套原始视频文件,方便研发团队按需调用。
从数据维度来看,该数据集可广泛应用于多个具身智能研发场景:包括机器人末端执行器的精准控制模型训练、特定几何物体的视觉识别与定位算法研发、单任务作业的轨迹规划模型训练、多模态具身大模型的视觉-动作对齐训练等,也可为工业分拣、桌面操作等场景的机器人预训练提供标准化的基准数据支持。
查看push-blue-triangle-good-24-48-hsv-sam-fill-outline
Dataset card内容:
Files and versions内容:
当前全球数据要素市场正加快向垂直行业细分领域渗透,人工智能训练数据作为核心的数字生产要素,其开放共享程度直接决定了技术迭代的整体效率。此次该数据集的公开发布,进一步丰富了具身智能领域的细分数据集供给,也为行业内专项训练数据集的标准化构建、开放共享提供了参考样本,对推动中小研发团队降低技术门槛、加速具身智能技术落地具有积极意义。





_1769672084863.jpg)