five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

sweep_dataset_final_2机器人多模态数据集登陆HuggingFace 覆盖运动控制与视觉感知研发场景

五号数据雷达开源数据市场2026-05-06 23:4014
2026年5月6日,开发者saipuneethgottam在HuggingFace首发由LeRobot打造的sweep_dataset_final_2数据集,该数据集同步覆盖机器人运动参数与视觉数据,将为机器人运动控制、视觉感知领域的算法研发提供高质量训练数据支撑。

近年来,随着人形机器人、工业协作机器人赛道的快速爆发,运动控制算法迭代、视觉感知模型训练对高质量多模态同步数据集的需求持续攀升。相较于通用场景数据集,机器人领域数据集需要同时采集机械部件运动参数、环境视觉信息并实现毫秒级时间戳对齐,采集门槛高、标注成本大,已成为制约中小研发团队技术迭代的核心瓶颈之一。2026年5月6日,开发者saipuneethgottam在全球知名AI开源社区HuggingFace首发的sweep_dataset_final_2数据集,正是针对这一行业需求打造的垂直领域专用数据集。

saipuneethgottam本次发布的数据集sweep_dataset_final_2由LeRobot创建,包含机器人运动数据和相应的视觉数据两大核心维度。数据集结构包括动作、观察状态、时间戳等核心特征,具体涉及机器人的肩部、肘部、腕部和夹持器的全关节位置信息,以及对应时刻来自摄像头的同步采集图像数据。全数据集共包含5个连续场景片段,总计5908帧标注数据,采用压缩效率高、结构化读取性能优的parquet文件格式存储,并附有原始视频文件供研发人员交叉验证使用。

从典型应用方向来看,该数据集可广泛覆盖机器人领域多类研发需求:在运动控制场景下,可用于机械臂轨迹规划算法训练、夹持器抓取动作优化、关节运动误差校准等研发方向,帮助算法团队快速迭代运动控制精度;在视觉感知场景下,可支撑视觉伺服算法迭代、动态环境目标识别、机器人位姿视觉估算等模型的训练与效果验证,降低视觉感知模型的研发门槛;此外,该多模态同步数据集还可用于机器人领域多模态大模型的指令对齐训练,帮助大模型实现“视觉输入-运动指令输出”的端到端能力适配,加速通用机器人技术的落地进程。

作为垂直领域的高质量标注数据集,sweep_dataset_final_2的开放落地是全球AI开源社区数据要素共享的典型实践,一方面为中小机器人研发团队降低了多模态数据采集与标注的成本门槛,另一方面也为不同研发团队的算法效果对比提供了统一的基准测试数据集,对推动机器人领域技术开源、加速工业自动化、服务机器人等场景的商业化落地具有正向作用。

查看sweep_dataset_final_2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们