five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Wayl发布机器人专用训练数据集 登陆HuggingFace赋能行为记录与视觉导航研发

五号数据雷达开源数据市场2026-05-09 23:2011
机器人技术研发机构Wayl于2026年5月9日在全球开源AI社区HuggingFace首发20260509_120418_sc_01_train训练数据集,产品基于LeRobot框架构建,可广泛支撑机器人行为记录、视觉导航等方向的算法研发,进一步填补了具身智能领域高质量公开训练数据的供给缺口。

近年具身智能与商用机器人赛道进入快速落地期,算法性能的迭代高度依赖高质量的真实场景训练数据,但当前行业内公开的、标注完善且绑定机器人本体状态参数的多模态数据集供给缺口较大,大量中小研发团队受限于硬件成本、数据采集能力,难以开展复杂场景下的机器人算法研发。在此背景下,机器人技术研发机构Wayl于2026年5月9日在全球最大的AI开源社区HuggingFace正式上线全新训练数据集20260509_120418_sc_01_train,为行业提供了标准化的实测数据支撑。

该数据集基于HuggingFace推出的机器人学习专用开源框架LeRobot构建,所有数据均来自实体机器人的真实运行测试场景,覆盖四大类核心特征维度:包括机器人的动作执行参数、多维度观察数据(含机器人本体实时状态、多个机位同步采集的环境视觉图像)、高精度时间戳、序列索引,可满足不同技术方向的算法训练需求。数据集采用parquet结构化文件加原始视频文件的组合存储结构,既方便研发人员快速调用结构化特征开展模型训练,也可支撑计算机视觉方向的原始数据标注、模型微调工作。此外数据集配套的元数据完整披露了采集所用的机器人类型、总采集剧集、总帧数、对应测试任务等核心技术细节,研发团队可根据自身研发方向灵活筛选适配的数据子集,大幅降低数据预处理成本。

从应用价值来看,该数据集可覆盖多个机器人研发核心场景:在机器人行为记录方向,可用于训练机器人动作复刻模型、人机协作行为识别算法、异常动作预警系统,支撑工业机器人、家庭服务机器人的动作精准度优化;在视觉导航方向,多机位同步的视觉数据与机器人本体状态数据的一一绑定,可用于训练复杂环境下的自主避障算法、动态路径规划模型、室内外跨场景导航系统,有效减少研发团队自行搭建测试环境、采集实测数据的时间与硬件投入。除上述两大核心应用方向外,该数据集也可作为补充训练数据,用于具身智能大模型的多模态预训练、机器人数字孪生系统的真实场景校准等延伸场景。

作为公开开源的机器人专用训练数据集,本次产品的上线进一步丰富了全球具身智能领域的训练数据供给体系,降低了中小研发团队、高校科研团队的机器人算法研发门槛,对推动具身智能技术落地、加快机器人行业的技术迭代具有积极意义。

Wayl本次发布的数据集20260509_120418_sc_01_train,该数据集使用LeRobot创建,与机器人技术相关。数据集包含多种特征,如动作、观察(状态和来自多个摄像头的图像)、时间戳和索引。数据集结构包括parquet文件和视频文件。元数据提供了关于机器人类型、总剧集、帧数、任务和其他技术细节的具体信息。

查看20260509_120418_sc_01_train

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们