当前具身智能正处于商业化落地的关键爆发期,机器人精细操作、自主决策能力的迭代高度依赖高质量的场景化训练数据,而机器人抓取作为具身智能落地工业、民用场景的核心基础能力,长期面临公开训练数据维度不全、标注标准不统一的痛点,成为制约算法研发效率的核心瓶颈。在此背景下,技术厂商naavox正式发布垂直场景专用数据集grasp_w,该数据集于2026年4月29日首发上线全球知名AI开源社区HuggingFace,面向全球研发人员开放获取。
据介绍,grasp_w基于LeRobot框架创建,聚焦机器人抓取单一任务场景,覆盖全链路操作相关的多模态数据,既包含速度、手腕速度、手指速度等动作维度参数,也包含设备状态、多视角图像等观察维度数据。整个数据集共包含32个任务序列(episodes)、35284帧标注数据,所有结构化数据采用parquet格式存储,配套视频素材采用mp4格式存储,涵盖动作参数、设备观察状态、多摄像头采集图像、时间戳、帧索引、任务序列索引等完整特征维度,数据标注颗粒度满足端到端动作学习算法的训练要求。
从应用价值来看,grasp_w针对性覆盖了机器人抓取任务的全量数据维度,未来可广泛应用于多个具身智能落地场景的研发环节:比如工业场景下机械臂的零部件分拣、柔性物料搬运算法的预训练与基准测试,服务机器人的家用物品整理、助残辅助操作的动作策略优化,人形机器人的手部精细动作模仿学习、多场景抓取泛化能力训练等。相比通用机器人数据集,grasp_w的任务聚焦度更高、数据维度更全,研发团队可基于该数据集快速完成抓取算法的基础训练,大幅降低真实场景下的硬件测试与数据采集成本,缩短研发周期。
作为数据要素在具身智能垂直领域的典型落地成果,本次grasp_w数据集的发布进一步丰富了国内机器人操作类公开数据集的供给体系,也为全球机器人抓取领域的算法研发提供了标准化的测试基准,对推动动作学习技术的迭代升级、加快具身智能场景的商业化落地进度具有重要的行业意义。





_1769672084863.jpg)