首页 / 开源数据市场 / 正文

J-minsoo发布pick_place_block_position5机器人数据集覆盖抓取操作、视觉感知训练场景

五号数据雷达开源数据市场2026-04-30 02:4914

开发者J-minsoo于2026年4月29日在HuggingFace首发由LeRobot创建的pick_place_block_position5数据集，覆盖动作、多视角视觉、时间戳等全链路对齐维度，可为机器人抓取操作、视觉感知领域的算法研发与模型训练提供标准化数据支撑。

当前，具身智能、工业机器人赛道正处于技术规模化落地的关键周期，机器人抓取操作的精度、复杂场景下的视觉感知准确率，是决定相关产品商业化落地能力的核心指标，而标注完善、场景匹配的高质量训练数据集，正是支撑相关算法迭代的核心基础。过往公开的同类型数据集普遍存在感知数据与动作数据对齐度不足、视角覆盖不全等问题，一定程度上制约了中小研发团队的技术迭代效率。

近日，开发者J-minsoo正式上线pick_place_block_position5数据集，该数据集于2026年4月29日首发于HuggingFace平台，由LeRobot创建，专门面向机器人抓取操作、机器人视觉感知两大核心研发场景打造。

从公开参数来看，该数据集的结构覆盖动作、观察、时间戳、多维度索引四大类核心特征：其中观察类数据同时包含机器人运行状态数据、手腕摄像头及顶部固定摄像头的双视角图像数据，实现了动作执行数据与环境感知数据的全链路时间对齐；存储层面，结构化数据采用parquet格式存储，兼顾了高压缩率与快速读取性能，同时配套具备特定分辨率、编解码器和帧率标准的视频文件，可直接适配多数主流模型训练框架，大幅降低研发团队的预处理成本。

从典型应用场景来看，该数据集可广泛适配多个机器人研发方向：在工业场景中，可用于分拣、码垛机器人的抓取路径规划模型、视觉定位模型训练，提升机器人对不同位置、不同形态工件的抓取成功率；在服务机器人与人形机器人场景中，可支撑桌面物品整理、物料传递等场景的感知算法迭代，优化机器人在非结构化环境下的动作响应效率；此外，其多模态对齐的数据结构，也可用于具身大模型的“视觉理解-决策输出-动作执行”闭环能力训练。

作为具身智能领域数据要素供给的最新成果，本次数据集的公开上线，进一步丰富了全球机器人领域的公开训练数据供给，为中小研发团队降低了相关技术的研发门槛，对推动机器人抓取、视觉感知技术的落地普及具有积极意义。

查看pick_place_block_position5

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

J-minsoo发布pick_place_block_position5机器人数据集 覆盖抓取操作、视觉感知训练场景

Dataset card内容：

Files and versions内容：

社区讨论

J-minsoo发布pick_place_block_position5机器人数据集覆盖抓取操作、视觉感知训练场景