作为当前AI产业落地的核心赛道之一,具身智能的发展高度依赖高质量的实采训练数据:与仿真生成的数据相比,真实环境下采集的、同时包含感知输入与动作输出对应关系的标注数据集,能够大幅提升机器人模型在真实场景的泛化能力,降低落地适配成本。但长期以来,标注完善、场景针对性强的机器人实操数据集供给相对有限,成为中小研发团队、科研机构推进相关技术落地的普遍门槛。
近日,开发者ZackTang0307正式对外发布机器人学专用数据集black-foam-redX-merge-80eps-v2,该产品于2026年5月14日首发于全球最大的AI模型与数据集社区HuggingFace,是基于LeRobot框架打造的定向训练数据集,专为机器人操作类学习任务设计。
从数据构成来看,该数据集共包含80个完整的操作序列(episodes),总计38302帧采集数据,采集帧率为30fps,覆盖三类核心标注内容:第一类为动作数据,包含机器人肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置六大核心关节的位置参数;第二类为观察状态数据,同步记录与动作数据对应的实时关节位置信息,可用于动作反馈类模型的训练;第三类为多视角视觉数据,同步采集顶部相机、腕部相机、D435i深度相机三个视角的视频内容,所有视频分辨率为480x640、3通道,采用高压缩比的av1编码,在保证画质的前提下降低存储成本。此外,数据集还配套完整的时间戳、帧索引、episode索引等元数据,方便研发人员按需截取训练片段。全量数据以parquet格式存储,结构化数据文件总大小为100MB,配套视频文件大小为200MB,轻量化的存储设计适合小样本训练、快速算法迭代等场景。
从应用场景来看,该数据集可广泛适配机器人控制、模仿学习、强化学习等多个具身智能研发方向:既可用于工业机器人小件抓取、精细化装配等任务的模仿学习训练,也可用于多模态机器人控制算法的效果验证,其多视角的视觉数据还可支撑机器人视觉感知与动作执行联动的模型研发,帮助算法团队快速验证“视觉输入-动作输出”的链路效果。
业内分析指出,这类垂直场景的高质量开放数据集的出现,将进一步降低具身智能领域的研发门槛,推动机器人操作学习相关技术的落地迭代,为数据要素赋能AI前沿赛道发展提供典型样本。
查看black-foam-redX-merge-80eps-v2





_1769672084863.jpg)