当前具身智能正进入产业化落地的关键周期,而基于真实机器人运行场景的高质量标注数据集,是支撑机器人操作学习、伺服控制算法迭代的核心基础设施,长期以来存在场景覆盖不全、模态匹配度低、标注标准不统一等行业痛点。近日,机器人技术厂商DAVIAN-Robotics正式发布专用机器人操作数据集dh_tasks,该数据集于2026年5月24日首发上线HuggingFace平台,面向全球研发者开放使用。
据介绍,dh_tasks是依托HuggingFace旗下机器人学习专用工具链LeRobot搭建的标准化采集框架生成,是国内少数面向通用机器人控制任务的公开数据集之一。本次发布的数据集共包含100个完整任务序列(episodes),累计31283帧有效数据,覆盖8类不同的典型机器人操作场景,所有数据均来自Franka协作机器人的真实运行采集,整体采用parquet结构化格式存储,配套视觉文件为20fps帧率的MP4格式,兼顾了数据检索效率和多场景适配能力。
从数据维度来看,dh_tasks实现了机器人状态、动作指令、多视角视觉三大核心模态的全匹配标注:其中机器人状态观测维度达29维,完整覆盖关节位置、速度、末端执行器位置、姿态、线速度、角速度、夹爪位置和抓取状态等核心运行参数;动作标注维度为8维,包含末端执行器位置、姿态和夹爪控制的完整指令序列;视觉观测同步采集左后、手腕、右后三个机位的实时画面,单帧图像为3通道480*640分辨率,可支撑多视角视觉算法的训练需求。此外数据集还配套了时间戳、帧索引、episode索引、任务索引等完整元数据,为算法训练的场景拆分、精度校验提供了标准化依据。
从应用方向来看,dh_tasks主要面向机器人操作学习、视觉伺服控制两大核心研发场景,可用于训练和评估各类机器人控制算法,尤其是基于视觉和状态反馈的强化学习、模仿学习模型。典型应用场景包括但不限于:为工业协作机器人的抓取、装配、物料搬运等任务提供训练数据支撑,提升复杂场景下的操作精度;为服务机器人的动态避障、精准交互等功能研发提供多模态验证基准;为视觉伺服控制算法的迭代提供真实场景下的反馈数据,降低实机测试的成本和安全风险。
业内分析指出,随着数据要素市场建设的持续推进,垂直领域专用数据集的开放共享,是降低新兴技术研发门槛、加速产业化落地的核心路径。dh_tasks的发布填补了国内公开机器人操作数据集的场景缺口,对于推动具身智能、工业机器人等领域的技术研发具有重要的支撑作用。





_1769672084863.jpg)