首页 / 开源数据市场 / 正文

aaawangge发布多模态跟随机器人专用数据集eval_so101_total_rl_box 已上线HuggingFace 支撑机器人视觉控制等场景研发

五号数据雷达开源数据市场2026-05-06 23:576

2026年5月6日，创作者aaawangge在HuggingFace首发多模态机器人数据集eval_so101_total_rl_box，该数据集专为bi_so_follower类型跟随机器人打造，可为机器人视觉控制、跟随行为学习等方向的研发提供高质量训练与验证数据支撑，助力具身智能技术落地。

当前全球具身智能产业正处于商业化落地的关键窗口期，跟随型机器人作为落地场景最清晰、需求最迫切的品类之一，在工业巡检、消费陪护、物流配送等多个领域的应用规模快速扩张。但长期以来，细分场景下的高质量多模态训练数据缺口，始终是制约跟随机器人控制算法迭代、行为决策精准度提升的核心瓶颈。

aaawangge本次发布的数据集eval_so101_total_rl_box正是瞄准这一行业痛点推出的专用训练资源，该数据集基于LeRobot框架创建，专为bi_so_follower类型的跟随机器人研发打造，覆盖机器人运行全链路的多维度数据：既包含机器人的动作指令、运行状态等核心控制数据，也收录了来自多个机位摄像头的实时视觉观测数据，同时还补充了策略动作记录、人工干预标记等特殊场景数据，能够完整还原跟随机器人的真实运行逻辑。数据集共收录5个完整运行片段（episodes）、累计5432帧有效数据，采用分块存储设计以提升调用效率，整体以结构化parquet文件+原始视频的形式存储，是典型的融合数值状态数据与视觉输入的多模态数据集，可适配强化学习、视觉大模型微调等多种训练需求。

查看eval_so101_total_rl_box

从应用场景来看，该数据集可直接应用于两大核心研发方向：一是机器人视觉控制领域，研究人员可基于多摄像头视觉数据与对应动作指令的关联关系，训练机器人的动态环境识别、动态避障、精准动作响应等能力，提升机器人在复杂场景下的自主控制水平；二是跟随型机器人行为学习领域，数据集覆盖的完整运行片段与干预标记，可帮助强化学习模型快速掌握跟随逻辑、优化异常场景应对策略，大幅降低研发团队的原始数据采集成本，加快模型迭代效率。作为数据要素在具身智能领域的典型落地成果，该类细分场景专用数据集的推出，也将进一步完善我国机器人产业的数据供给体系，为数字经济与实体产业的融合落地提供底层支撑。

Dataset card内容：

Files and versions内容：

社区讨论

近期热门