近年来,具身智能产业进入落地爆发期,机器人抓取作为工业自动化、服务机器人场景的核心通用能力,其算法训练高度依赖覆盖动作参数、运行状态、视觉感知的多模态同步标注数据集,而细分场景下的高质量、低门槛训练数据,长期是制约行业研发效率的核心瓶颈。近日,数据提供方kunhsiang正式发布eval_exp9_a1_grasp_the_small_box_20260504-194801专项数据集,该数据集于2026年5月4日首发于全球最大的AI模型与数据集社区HuggingFace,面向机器人抓取、多模态具身感知两大核心研发场景开放使用。
该数据集由LeRobot创建,覆盖机器人动作、观察状态、视觉信息三类核心多模态数据,整体结构包含结构化数据文件、原始采集视频、标注特征三大模块。具体特征维度包括:6个关节的动作指令数据、6个关节的实时运行状态数据,同时同步采集了机器人前视、顶部、夹爪三个视角的实时图像,所有图像分辨率为480x640,采集帧率为30fps,整个数据集围绕小盒抓取单个任务录制,包含1个完整动作片段,总计835帧同步标注数据,数据标注完全对齐,无需二次处理即可直接用于算法训练。
从应用价值来看,该数据集可覆盖多个典型研发场景:对于机器人抓取算法研发团队而言,同步的关节状态与多视角视觉数据,可用于训练基于视觉反馈的闭环抓取控制模型,提升小体积、易滑动物件的抓取成功率,这类能力可应用于3C电子制造的小件分拣、仓储物流的拆零拣选、家用服务机器人的桌面物品拾取等场景;其次,数据集的多模态对齐标注,也可为多模态具身感知算法研发提供训练素材,支撑“视觉-动作”跨模态表征模型的训练,大幅降低中小研发团队的原始数据采集与标注成本。
当前我国数据要素市场建设持续推进,面向人工智能研发的高质量训练数据集作为核心数据要素品类,是支撑人工智能产业尤其是具身智能赛道落地的核心基础资源,本次细分场景专项数据集的开放,也将进一步丰富国内具身智能领域的训练数据供给,为行业研发提供更多底层支撑。
查看eval_exp9_a1_grasp_the_small_box_20260504-194801





_1769672084863.jpg)