随着具身智能产业进入快速落地期,机器人模仿学习、视觉伺服控制作为支撑工业机械臂、协作机器人实现自主作业的核心技术,长期面临高匹配度、全维度标注训练数据集供给不足的行业痛点,中小研发团队往往需要投入大量成本完成数据采集、标注工作,大幅拉长了研发周期。robot-learning-team43本次发布的数据集rollout_dagger_smolvla_20260515_142318正是瞄准这一行业需求打造,该数据集由LeRobot开源框架创建,专门面向机器人学相关研发任务设计,完整覆盖机械臂作业过程中的动作、观测多模态数据。数据集具体字段包含:动作参数(覆盖6个关节位置:肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置,对应so_follower型机器人的全自由度运动维度)、观测状态(与动作维度一致的6个关节位置数据,可用于模型输出结果的对照校验)、观测图像(来自camera1的第一视角采集内容,分辨率为480x640,3通道RGB视频,采用av1编码平衡画质与存储效率,帧率30fps,完整还原机械臂作业的真实视觉场景)、干预标志(布尔值,可用于区分人类干预矫正动作与机器人自主执行动作,帮助研发团队快速筛选有效训练样本),此外还包含时间戳、帧索引、episode索引、索引、任务索引等对齐字段,实现了多模态数据的毫秒级匹配,大幅降低研发团队的数据预处理成本。该数据集总共有2个episodes,746帧,覆盖1个标准化作业任务,结构化数据文件大小为100MB,采用parquet格式存储方便算法直接调用,视频文件大小为200MB,采用通用mp4格式存储,机器人适用类型为so_follower。从应用场景来看,该数据集可广泛用于机器人模仿学习算法的轨迹训练、视觉伺服控制模型的视觉-动作映射关系校准、机器人学习算法的基准性能测试等场景,为学术研究、中小团队技术研发提供低门槛的标准化训练素材,也为后续更大规模机械臂作业数据集的标注规范制定提供了参考。
查看rollout_dagger_smolvla_20260515_142318





_1769672084863.jpg)