当前人形机器人商业化进程加速,双臂协同操作、复杂场景动作规划已经成为机器人从工业场景走向办公、居家等通用服务场景的核心技术瓶颈,而覆盖多模态信息的高质量场景化训练数据集,是相关算法迭代的核心基础,长期以来存在供给不足、标注质量参差不齐的行业痛点。
2026年5月7日,开发者aaawangge正式首发so101_bimanual_pen_holder_tidy数据集,该数据集由LeRobot团队创建,瞄准机器人技术领域双手机器人操作、动作规划的核心训练需求,为相关研发提供标准化的高质量数据支撑。
据了解,该数据集共包含140个完整操作episodes、70822帧有效数据,覆盖2项核心操作任务,所有数据采用高效易读取的parquet格式存储,方便研发团队快速接入训练流程。从数据维度来看,该数据集不仅详细记录了机器人左右肩、肘、腕、夹持器的全节点动作位置数据,还同步收录了与动作数据对齐的观察状态数据、480x640分辨率30fps帧率的多视角图像数据,以及干预状态、策略ID等补充标注信息,实现了双手机器人操作全流程数据的完整覆盖。
其中全节点动作数据可用于训练双臂协同操作的轨迹规划模型,降低双臂运动碰撞概率,提升精细操作的精度;多视角同步图像数据可支撑视觉-动作多模态模型的训练,帮助机器人实现基于视觉感知的动态动作调整,减少对额外硬件传感器的依赖;干预状态、策略ID等补充信息则可用于算法效果的精准评估,区分人工干预与自主操作场景,进一步优化模型的鲁棒性与泛化能力。
从应用方向来看,该数据集可广泛应用于多个机器人研发场景:在双手机器人精细操作训练领域,可支撑办公场景文具整理、工业场景小零件组装、居家场景物品收纳等场景的算法训练;在机器人动作规划领域,可用于复杂任务排序、动态场景避障、人机协同操作等方向的算法研发;同时也可作为基础数据集,支撑多模态机器人大模型的视觉-动作对齐训练,推动端到端机器人操作模型的迭代。
业内人士指出,场景化专用数据集的公开供给,是数据要素赋能AI产业发展的典型实践,本次数据集的发布,将有效降低双手机器人研发团队的数据集采集与标注成本,缩短相关算法的研发周期,进一步推动双手机器人在通用服务场景的商业化落地进程。
查看so101_bimanual_pen_holder_tidy





_1769672084863.jpg)