five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

robot-learning-team43发布多模态机器人训练数据集 支撑模仿学习、视觉伺服控制技术研发

五号数据雷达开源数据市场2026-05-16 00:1520
近日,机器人学习研发团队robot-learning-team43基于LeRobot开源框架打造的rollout_dagger_smolvla_20260515_142318数据集正式首发于HuggingFace平台,该数据集同步覆盖机械臂动作参数、第一视角视觉观测等多维度标注内容,可为机器人模仿学习、视觉伺服控制领域的算法研发提供标准化训练支撑。

随着具身智能产业进入快速落地期,机器人模仿学习、视觉伺服控制作为支撑工业机械臂、协作机器人实现自主作业的核心技术,长期面临高匹配度、全维度标注训练数据集供给不足的行业痛点,中小研发团队往往需要投入大量成本完成数据采集、标注工作,大幅拉长了研发周期。robot-learning-team43本次发布的数据集rollout_dagger_smolvla_20260515_142318正是瞄准这一行业需求打造,该数据集由LeRobot开源框架创建,专门面向机器人学相关研发任务设计,完整覆盖机械臂作业过程中的动作、观测多模态数据。数据集具体字段包含:动作参数(覆盖6个关节位置:肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置,对应so_follower型机器人的全自由度运动维度)、观测状态(与动作维度一致的6个关节位置数据,可用于模型输出结果的对照校验)、观测图像(来自camera1的第一视角采集内容,分辨率为480x640,3通道RGB视频,采用av1编码平衡画质与存储效率,帧率30fps,完整还原机械臂作业的真实视觉场景)、干预标志(布尔值,可用于区分人类干预矫正动作与机器人自主执行动作,帮助研发团队快速筛选有效训练样本),此外还包含时间戳、帧索引、episode索引、索引、任务索引等对齐字段,实现了多模态数据的毫秒级匹配,大幅降低研发团队的数据预处理成本。该数据集总共有2个episodes,746帧,覆盖1个标准化作业任务,结构化数据文件大小为100MB,采用parquet格式存储方便算法直接调用,视频文件大小为200MB,采用通用mp4格式存储,机器人适用类型为so_follower。从应用场景来看,该数据集可广泛用于机器人模仿学习算法的轨迹训练、视觉伺服控制模型的视觉-动作映射关系校准、机器人学习算法的基准性能测试等场景,为学术研究、中小团队技术研发提供低门槛的标准化训练素材,也为后续更大规模机械臂作业数据集的标注规范制定提供了参考。

查看rollout_dagger_smolvla_20260515_142318

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们