five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【具身智能数据动态】juyoungggg于HuggingFace首发机器人专用数据集 可支撑运动控制、感知技术研发

五号数据雷达开源数据市场2026-05-04 23:5417
开发者juyoungggg于2026年5月4日在全球知名AI开源社区HuggingFace首发0504-tidy-test-5机器人专用数据集,该数据集依托LeRobot框架构建,覆盖多维度机器人运行特征,可为机器人运动控制、环境感知等领域的算法训练提供标准化数据支撑。

近年来具身智能产业进入爆发增长期,机器人运动控制精度、环境感知准确率的核心能力提升,高度依赖高质量、多维度的场景训练数据,而标注完善、结构统一的专用机器人数据集一直是行业研发的核心刚需。近日,开发者juyoungggg正式在HuggingFace平台首发名为0504-tidy-test-5的机器人专用数据集,进一步丰富了具身智能领域的公共训练数据供给。

本次发布的0504-tidy-test-5数据集依托LeRobot工具创建,LeRobot是目前全球主流的机器人学习开源工具栈,广泛应用于机器人运动数据采集、算法训练与效果验证场景,依托其生成的数据集具备统一的结构化标准,可适配绝大多数主流机器人训练框架。该数据集共包含20个完整任务运行周期(episodes)、5710帧有效采样数据,对应1项标准化机器人操作任务,总数据体量约300MB,其中结构化数据文件大小为100MB、配套视频文件大小为200MB,采样帧率为30fps,可满足高频动作训练的时序数据精度需求。

数据集覆盖多维度关联特征,包括6个关节的实时动作数据、同维度的关节观察状态数据,同时同步采集了前视、顶视两个视角的480*640分辨率RGB图像,以及配套的时间戳、帧索引、episode索引、索引和任务索引等关联字段,形成了“动作反馈-环境感知-时序标注”的完整数据闭环。存储规格上,结构化数据采用高效的parquet格式存储,可大幅降低训练环节的数据读取开销,配套视频采用通用MP4格式,便于研究人员复盘验证动作逻辑。

从潜在应用场景来看,该数据集可广泛服务于多类机器人技术研发需求:在运动控制领域,研究人员可依托关节动作与状态的对应数据,训练机械臂的轨迹规划、力控调节算法,提升复杂动作的执行精度;在机器人感知领域,双视角图像与关节状态的联动数据,可用于优化视觉定位、环境识别、障碍物规避等算法的准确率,降低感知与动作的协同误差;此外,标准化的时序标注数据还可用于具身智能大模型的微调训练,提升大模型对实体操作指令的拆解执行能力。作为开源共享的机器人专用数据集,本次发布的0504-tidy-test-5为中小研发团队、学术机构降低了数据采集门槛,对推动机器人技术的开源协同创新、加快数据要素在AI研发领域的流通应用具有积极意义。

查看0504-tidy-test-5

Dataset card内容:

数据集卡片展示

Files and versions内容:

数据集文件版本展示

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们