当前具身智能已成为人工智能落地的核心赛道,而高质量、场景化的标注数据集是支撑机器人控制算法、多模态大模型迭代的核心底座,针对细分机械臂类型的公开训练数据长期存在供给缺口。作为当前行业主流的机器人数据集开源构建工具,Meta推出的LeRobot框架已被全球开发者广泛用于机械臂控制、具身智能模型训练的数据生产环节,持续丰富全球机器人学开源数据生态。
近日,开发者ApaydinK正式发布基于LeRobot构建的机器人学数据集le-robot_levke3,该数据集于2026年5月16日首发于HuggingFace社区,目前已开放公开访问。
据公开信息显示,le-robot_levke3共包含3个数据总集、3762帧同步标注数据,总大小约300MB,其中结构化标注数据100MB、配套视频数据200MB;结构化数据采用业界通用的parquet格式存储,可直接对接PyTorch、TensorFlow等主流AI训练框架,视频素材采用标准mp4格式封装,大幅降低开发者的数据集适配成本。
该数据集的标注维度覆盖三大类核心特征:一是动作标注层,包含肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部滚动、夹爪位置共6个浮点型关节位置参数,完整覆盖小型机械臂的核心运动维度;二是观察状态层,除同步采集的6个关节位置参数外,还搭载后置、顶部双机位拍摄的实时视频流,分辨率为480x640、3通道、帧率30fps,可充分满足视觉强化学习的多视角感知训练需求;三是元数据层,配套有时间戳、帧索引、集索引、任务索引等维度标注,支持开发者按需截取数据集片段,完成针对性的小样本训练、算法验证等需求。该数据集适配so_follower型机械臂,当前覆盖1类典型操作任务,可直接用于训练和评估机器人控制模型,适用于强化学习或模仿学习类研发任务。
从应用场景来看,le-robot_levke3可支撑多个细分领域的研发需求:在工业协作机器人领域,可用于小型机械臂的高精度关节控制、轨迹规划、力控调整算法的训练与评估,减少研发团队的实地数据采集成本;在具身智能领域,同步的多视角视觉数据+关节参数可支撑“视觉感知-动作输出”的端到端模型训练,覆盖工业分拣、实验室样品转运、桌面级精密操作等典型落地场景;此外,该数据集还可作为机器人仿真与真机迁移的验证基准,为相关算法的跨环境适配提供标准化测试依据。
本次le-robot_levke3数据集的发布,填补了so_follower型机械臂细分场景的公开训练数据空白,为中小研发团队、学术研究机构降低了具身智能领域的研发门槛,也为全球机器人学开源数据生态补充了优质的细分场景数据源。
首页 / 开源数据市场 / 正文
ApaydinK在HuggingFace首发le-robot_levke3数据集 赋能机器人关节控制、视觉强化学习研发
五号数据雷达开源数据市场2026-05-17 00:0714
开发者ApaydinK于2026年5月16日在全球头部AI开源社区HuggingFace首发le-robot_levke3机器人学数据集,可为机器人控制模型训练、强化学习/模仿学习任务提供标准化多模态数据源,有效降低具身智能领域研发门槛。

社区讨论
近期热门




_1769672084863.jpg)