随着具身智能产业进入快速落地期,高质量、机型适配的专用训练数据集已成为机器人算法研发的核心刚需——相比通用视觉、NLP领域成熟的开源数据集供给,面向细分机器人品类的标注数据长期存在稀缺性高、兼容性差、许可限制多等痛点,大幅抬高了中小开发者的研发门槛。2026年5月15日,开发者marshin68正式上线的xlerobot_test1数据集,正是针对双轮XLerobot客户端打造的垂直类开源训练数据集,为该机型的算法研发提供了标准化的数据底座。
据介绍,该数据集依托LeRobot框架构建,该框架是当前全球机器人学习领域通用的专业数据集生产工具,可实现机器人数据采集、标注、存储的全流程标准化,保障数据集的跨平台兼容性。本次发布的xlerobot_test1覆盖了机器人研发核心需求的多维度标注数据:其一为全链路观察状态数据,包含左右臂全部关节位置数据(覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部滚动、夹爪位置全维度)、头部电机位置数据,以及机器人运行的线速度、角速度数据,可完整还原机器人运动过程中的全量状态参数;其二为多视角视觉数据,同步收录了机器人头部摄像头、左腕摄像头、右腕摄像头采集的实时视频图像,分辨率为480x640、帧率30fps,采用高效的AV1编解码器,在保证画质的前提下大幅降低了存储体积;其三为对齐标注的动作数据,与观察状态数据的特征维度完全匹配,可直接用于监督学习训练。
此外,数据集还配套了完整的元数据体系,覆盖时间戳、帧索引、episode索引、任务索引等核心字段,方便开发者快速筛选所需训练样本。从规模来看,本次发布的版本共包含2个episodes、1798帧数据、对应1个典型任务,结构化数据文件以parquet格式存储、视频文件以mp4格式存储,其中结构化数据总大小约为100MB,视频数据总大小约为200MB,整体体积适中,适合开发者快速下载调试。值得关注的是,该数据集采用开源友好的Apache 2.0许可证,允许开发者自由修改、分发甚至商用,大幅降低了研发侧的使用门槛。
从应用场景来看,xlerobot_test1数据集可广泛支撑机器人领域的多项核心技术研发:在机器人状态估计领域,开发者可通过对齐的状态数据与视觉数据,训练双轮移动机器人在动态场景下的位姿估算能力,提升复杂环境下的运动稳定性;在视觉伺服控制领域,多视角的视觉数据搭配对应的关节动作标注,可用于训练机器人基于实时视觉反馈的精细化操作能力,优化抓取、装配等作业任务的动作精度;此外,该数据集还可作为小样本机器人学习算法的基准测试集,帮助开发者快速验证模型有效性。作为面向细分机型的专用开源数据集,xlerobot_test1的发布进一步填补了双轮XLerobot生态的训练数据空白,对降低中小开发者的具身智能研发门槛,推动机器人控制技术的普惠化创新具有积极意义。
查看xlerobot_test1
首页 / 开源数据市场 / 正文
marshin68发布xlerobot_test1双轮机器人专用数据集 支撑状态估计、视觉伺服控制核心研发
五号数据雷达开源数据市场2026-05-16 00:199
2026年5月15日,开发者marshin68在HuggingFace平台首发xlerobot_test1双轮XLerobot专用数据集,该数据集依托LeRobot框架构建,覆盖多维度运动状态与多视角视觉标注数据,可广泛应用于机器人状态估计、视觉伺服控制等领域研发,助力降低具身智能技术落地门槛。

社区讨论
近期热门




_1769672084863.jpg)