首页 / 开源数据市场 / 正文

kunhsiang发布小盒抓取专项多模态数据集首发HuggingFace赋能机器人抓取与具身感知研发

五号数据雷达开源数据市场2026-05-05 00:067

数据提供方kunhsiang于2026年5月4日在全球AI社区HuggingFace首发eval_exp9_a1_grasp_the_small_box_20260504-194801数据集，该数据集由LeRobot打造，覆盖机器人关节状态、多视角视觉等多维度同步标注数据，可直接支撑机器人抓取算法、多模态具身感知等方向的研发训练。

近年来，具身智能产业进入落地爆发期，机器人抓取作为工业自动化、服务机器人场景的核心通用能力，其算法训练高度依赖覆盖动作参数、运行状态、视觉感知的多模态同步标注数据集，而细分场景下的高质量、低门槛训练数据，长期是制约行业研发效率的核心瓶颈。近日，数据提供方kunhsiang正式发布eval_exp9_a1_grasp_the_small_box_20260504-194801专项数据集，该数据集于2026年5月4日首发于全球最大的AI模型与数据集社区HuggingFace，面向机器人抓取、多模态具身感知两大核心研发场景开放使用。

该数据集由LeRobot创建，覆盖机器人动作、观察状态、视觉信息三类核心多模态数据，整体结构包含结构化数据文件、原始采集视频、标注特征三大模块。具体特征维度包括：6个关节的动作指令数据、6个关节的实时运行状态数据，同时同步采集了机器人前视、顶部、夹爪三个视角的实时图像，所有图像分辨率为480x640，采集帧率为30fps，整个数据集围绕小盒抓取单个任务录制，包含1个完整动作片段，总计835帧同步标注数据，数据标注完全对齐，无需二次处理即可直接用于算法训练。

从应用价值来看，该数据集可覆盖多个典型研发场景：对于机器人抓取算法研发团队而言，同步的关节状态与多视角视觉数据，可用于训练基于视觉反馈的闭环抓取控制模型，提升小体积、易滑动物件的抓取成功率，这类能力可应用于3C电子制造的小件分拣、仓储物流的拆零拣选、家用服务机器人的桌面物品拾取等场景；其次，数据集的多模态对齐标注，也可为多模态具身感知算法研发提供训练素材，支撑“视觉-动作”跨模态表征模型的训练，大幅降低中小研发团队的原始数据采集与标注成本。

当前我国数据要素市场建设持续推进，面向人工智能研发的高质量训练数据集作为核心数据要素品类，是支撑人工智能产业尤其是具身智能赛道落地的核心基础资源，本次细分场景专项数据集的开放，也将进一步丰富国内具身智能领域的训练数据供给，为行业研发提供更多底层支撑。

查看eval_exp9_a1_grasp_the_small_box_20260504-194801

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

kunhsiang发布小盒抓取专项多模态数据集 首发HuggingFace赋能机器人抓取与具身感知研发

Dataset card内容：

Files and versions内容：

社区讨论

kunhsiang发布小盒抓取专项多模态数据集首发HuggingFace赋能机器人抓取与具身感知研发