当前全球具身智能产业正处于商业化落地的关键窗口期,跟随型机器人作为落地场景最清晰、需求最迫切的品类之一,在工业巡检、消费陪护、物流配送等多个领域的应用规模快速扩张。但长期以来,细分场景下的高质量多模态训练数据缺口,始终是制约跟随机器人控制算法迭代、行为决策精准度提升的核心瓶颈。
aaawangge本次发布的数据集eval_so101_total_rl_box正是瞄准这一行业痛点推出的专用训练资源,该数据集基于LeRobot框架创建,专为bi_so_follower类型的跟随机器人研发打造,覆盖机器人运行全链路的多维度数据:既包含机器人的动作指令、运行状态等核心控制数据,也收录了来自多个机位摄像头的实时视觉观测数据,同时还补充了策略动作记录、人工干预标记等特殊场景数据,能够完整还原跟随机器人的真实运行逻辑。数据集共收录5个完整运行片段(episodes)、累计5432帧有效数据,采用分块存储设计以提升调用效率,整体以结构化parquet文件+原始视频的形式存储,是典型的融合数值状态数据与视觉输入的多模态数据集,可适配强化学习、视觉大模型微调等多种训练需求。
从应用场景来看,该数据集可直接应用于两大核心研发方向:一是机器人视觉控制领域,研究人员可基于多摄像头视觉数据与对应动作指令的关联关系,训练机器人的动态环境识别、动态避障、精准动作响应等能力,提升机器人在复杂场景下的自主控制水平;二是跟随型机器人行为学习领域,数据集覆盖的完整运行片段与干预标记,可帮助强化学习模型快速掌握跟随逻辑、优化异常场景应对策略,大幅降低研发团队的原始数据采集成本,加快模型迭代效率。作为数据要素在具身智能领域的典型落地成果,该类细分场景专用数据集的推出,也将进一步完善我国机器人产业的数据供给体系,为数字经济与实体产业的融合落地提供底层支撑。





_1769672084863.jpg)