当前,协作机器人、工业服务机器人的智能化迭代速度不断加快,基于机器视觉的引导操作技术是机器人完成物料搬运、分拣、装配等场景任务的核心能力,而真实场景下的多模态配对数据集,一直是制约相关算法泛化性提升的核心供给瓶颈。近日,开发者kunhsiang正式对外发布eval_exp10_grasp_the_red_box_20260507-190930专项数据集,该数据集由LeRobot创建,于2026年5月7日率先在HuggingFace平台上线,面向全球机器人研发领域开放使用。
据公开信息显示,该数据集属于机器人领域专项训练数据,整体结构覆盖多维度交叉特征,既包含机器人本体的运动数据:包括动作指令维度的6个关节位置数据、观测状态维度的6个关节位置数据,实现了机器人执行端全链路运动数据的完整留存;也覆盖多视角视觉采集数据,包含前视、顶部、夹爪三个核心视角的视频流,分辨率为480x640、帧率达30fps,可还原真实抓取场景下的全视角视觉特征。整个数据集覆盖1个完整的红盒抓取任务周期,共包含1个episode、2462帧有效标注数据,结构化数据采用parquet格式存储,视频素材采用通用mp4格式封装,无需额外格式转换即可直接接入主流AI训练框架。授权方面,该数据集采用apache-2.0许可证,开发者可免费用于非商用、商用场景的二次开发,仅需按要求保留原始版权声明即可。
查看eval_exp10_grasp_the_red_box_20260507-190930完整数据集信息
作为聚焦规则物体抓取场景的专项多模态数据集,该产品可覆盖多个机器人研发的典型应用方向:首先是机器人抓取算法训练,多视角视觉数据与关节运动数据的配对标注体系,可用于训练端到端的视觉抓取模型,提升算法在规则物体抓取场景下的定位精度、路径规划合理性;其次是视觉引导操作技术验证,开发者可基于该数据集测试多模态传感融合的引导算法,大幅降低真实物理环境下的测试算力与时间成本;此外也可作为仿真到真实迁移(Sim2Real)算法的验证基准,帮助开发者对比仿真数据与真实场景数据的特征差异,优化模型在不同场景下的泛化能力,也可为工业场景下的物料分拣、3C制造领域的零部件搬运等场景的算法提供预训练素材,减少企业自研数据集的采集与标注成本。
从行业价值来看,机器人产业是数字经济与先进制造融合的核心赛道,高质量标注的场景化数据集是机器人智能水平提升的核心底座,本次发布的数据集进一步丰富了LeRobot系列的机器人专用数据生态,为全球机器人开发者提供了标准化的真实场景训练素材,对降低机器人智能算法研发门槛、加快视觉引导操作技术的落地迭代具有积极意义。





_1769672084863.jpg)