当前具身智能产业正处于技术落地的关键阶段,机器人抓取、动态操作等通用能力的训练,高度依赖场景匹配度高、模态覆盖全的高质量标注数据集,而面向细分操作场景的公开训练数据供给不足,一直是制约中小团队研发效率的核心痛点之一。近日,开发者tatsuyaaaaaaa正式发布so_arm101_pick_red_dice_sim_dr数据集,该数据集于2026年5月10日首发于HuggingFace平台,可广泛应用于机器人抓取任务研发、模拟学习模型训练等领域。
据介绍,本次发布的数据集基于LeRobot项目创建,属于机器人技术领域的垂直场景专用训练数据。作为HuggingFace旗下面向具身智能领域的开源协作项目,LeRobot旨在通过开放训练数据、工具链与预训练模型的方式,降低机器人学习的研发门槛,推动行业技术普惠,本次发布的数据集正是该生态下的最新落地成果。数据集涵盖多维度核心信息,包括机器人动作数据、状态观测数据、多视角摄像头采集的图像数据以及对应时间戳等;具体数据结构方面,包含6维的动作与状态观测数据,以及来自三个不同安装位摄像头的视频数据(分辨率480x640,帧率30fps)。全数据集共收录100个完整任务片段(episodes),总帧数达109500帧,仅覆盖红色骰子抓取1项核心任务,数据采用parquet结构化文件与mp4视频文件两类格式存储,既满足了结构化数据的快速调用需求,也保留了原始视觉数据的二次开发空间。
从应用价值来看,该数据集可覆盖多类机器人学习研发需求:一是可用于模拟到真实(Sim2Real)的迁移学习训练,从数据集命名中的「sim_dr」标识可推测其内置域随机化设置,可帮助模型提升在不同光照、背景、机械臂参数等复杂环境下的抓取鲁棒性,降低模拟环境训练结果到真实场景落地的适配成本;二是可支撑小目标精准抓取算法研发,针对红色骰子的特定抓取任务,可用于机械臂视觉定位、力控调整、动态路径规划等细分模块的训练与效果验证;三是可服务于多模态机器人学习模型的预训练,融合动作、状态、多视角视觉的多模态数据,能够支撑端到端机器人操作通用模型的研发。此外,该数据集采用符合LeRobot生态标准的存储格式,可直接与生态内的工具链、预训练模型适配,进一步降低研发团队的适配成本。
在数据要素成为人工智能产业核心生产资料的当下,垂直场景的高质量开源数据集是推动技术普惠的重要基础。本次针对机器人抓取场景的专用数据集发布,进一步丰富了具身智能领域的开源数据供给,对降低中小团队的机器人学习研发成本、推动模拟学习技术的落地迭代具有积极的行业意义。
查看so_arm101_pick_red_dice_sim_dr





_1769672084863.jpg)