five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

kunhsiang发布小盒抓取专项多模态数据集 首发HuggingFace赋能机器人抓取与具身感知研发

五号数据雷达开源数据市场2026-05-05 00:067
数据提供方kunhsiang于2026年5月4日在全球AI社区HuggingFace首发eval_exp9_a1_grasp_the_small_box_20260504-194801数据集,该数据集由LeRobot打造,覆盖机器人关节状态、多视角视觉等多维度同步标注数据,可直接支撑机器人抓取算法、多模态具身感知等方向的研发训练。

近年来,具身智能产业进入落地爆发期,机器人抓取作为工业自动化、服务机器人场景的核心通用能力,其算法训练高度依赖覆盖动作参数、运行状态、视觉感知的多模态同步标注数据集,而细分场景下的高质量、低门槛训练数据,长期是制约行业研发效率的核心瓶颈。近日,数据提供方kunhsiang正式发布eval_exp9_a1_grasp_the_small_box_20260504-194801专项数据集,该数据集于2026年5月4日首发于全球最大的AI模型与数据集社区HuggingFace,面向机器人抓取、多模态具身感知两大核心研发场景开放使用。

该数据集由LeRobot创建,覆盖机器人动作、观察状态、视觉信息三类核心多模态数据,整体结构包含结构化数据文件、原始采集视频、标注特征三大模块。具体特征维度包括:6个关节的动作指令数据、6个关节的实时运行状态数据,同时同步采集了机器人前视、顶部、夹爪三个视角的实时图像,所有图像分辨率为480x640,采集帧率为30fps,整个数据集围绕小盒抓取单个任务录制,包含1个完整动作片段,总计835帧同步标注数据,数据标注完全对齐,无需二次处理即可直接用于算法训练。

从应用价值来看,该数据集可覆盖多个典型研发场景:对于机器人抓取算法研发团队而言,同步的关节状态与多视角视觉数据,可用于训练基于视觉反馈的闭环抓取控制模型,提升小体积、易滑动物件的抓取成功率,这类能力可应用于3C电子制造的小件分拣、仓储物流的拆零拣选、家用服务机器人的桌面物品拾取等场景;其次,数据集的多模态对齐标注,也可为多模态具身感知算法研发提供训练素材,支撑“视觉-动作”跨模态表征模型的训练,大幅降低中小研发团队的原始数据采集与标注成本。

当前我国数据要素市场建设持续推进,面向人工智能研发的高质量训练数据集作为核心数据要素品类,是支撑人工智能产业尤其是具身智能赛道落地的核心基础资源,本次细分场景专项数据集的开放,也将进一步丰富国内具身智能领域的训练数据供给,为行业研发提供更多底层支撑。

查看eval_exp9_a1_grasp_the_small_box_20260504-194801

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们