随着具身智能产业进入快速落地期,机器人抓取、视觉动作控制等核心技术的研发对高质量标注数据集的需求持续攀升。相较于真实场景采集数据集,基于仿真环境生成的机器人训练数据集具备场景可控、标注精度高、采集成本低、无物理安全风险等优势,已成为当前具身智能算法迭代的核心数据支撑之一。本次由kimyg119发布的isaac_sim_voxposer_banana_pnp_v5数据集,基于英伟达Isaac Sim机器人仿真环境、通过LeRobot工具创建,主要面向机器人技术研发领域,已于2026年5月7日在全球最大的AI开源社区HuggingFace首发。
据公开信息显示,该数据集聚焦香蕉这类非刚性、外形不规则物品的拾取放置(Pick and Place,PNP)任务,共包含7个任务序列(episodes)、4458帧标注数据,采样帧率为30fps,其中结构化标注数据文件大小为100MB,配套同步视频文件大小为500MB,覆盖1项核心抓取任务。数据集的标注维度覆盖了机器人研发所需的多类核心信息:包括手腕摄像头、头顶摄像头两个视角的同步观察图像,机器人实时观察状态数据,机械臂动作指令数据,以及对应时间戳、帧索引、episode索引、索引和任务索引等配套标识信息,可满足不同技术路径的算法训练需求。
从应用场景来看,该数据集可广泛应用于多个领域的算法研发:包括家用服务机器人的桌面物品自动整理、生鲜仓储场景的软质果蔬自动分拣、餐饮服务机器人的食材转运等场景的抓取策略训练;同时多视角同步的图像数据与动作时序标注,也可为视觉伺服控制、端到端动作生成等前沿技术的验证提供数据支撑。当前,针对软质不规则物体的通用抓取算法仍是具身智能领域的技术攻坚方向,相关高质量训练数据的缺口长期存在,本次发布的数据集进一步丰富了机器人抓取场景的仿真数据供给,降低了中小研发团队的训练数据获取门槛,也为具身智能领域数据要素的开放共享提供了参考样本。
查看isaac_sim_voxposer_banana_pnp_v5





_1769672084863.jpg)