five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

开发者jake123456789发布双视角跟随机器人专用数据集 上线HuggingFace 赋能机器人视觉控制研发

五号数据雷达开源数据市场2026-05-16 00:178
开发者jake123456789于2026年5月15日在HuggingFace首发eval_2cameras_container_21_18数据集,该数据集基于LeRobot框架打造,面向跟随类机器人任务需求,可为机器人视觉跟随、关节运动控制等领域的算法训练、模型验证提供标准化高质量数据支撑。

当前,人形机器人、工业协作机器人赛道进入高速发展期,多模态实机采集标注数据作为机器人智能算法训练的核心生产要素,其稀缺性、标准化程度低已成为制约行业研发效率的核心瓶颈。近期,开发者jake123456789正式发布专门面向跟随类机器人任务的专用数据集eval_2cameras_container_21_18,该数据集于2026年5月15日首发于全球领先的AI模型与开源数据集社区HuggingFace,为细分场景的机器人研发提供了新的公共数据资源。

据了解,本次发布的数据集基于HuggingFace推出的机器人学习开源工具链LeRobot创建,完全适配跟随类型机器人的任务训练需求。数据集核心标注特征覆盖动作(action)和观察状态(observation.state)两大维度,均包含肩部平移、肩部提升、肘部弯曲、手腕弯曲、手腕旋转和夹爪位置共6个核心关节的位置数据,采用float32格式存储,精度可满足绝大多数工业级、消费级跟随机器人的控制训练要求。视觉数据方面,该数据集同时采集前视(front)全局视角和腕部(wrist)近场操作视角的两路视频流,前视图像分辨率为800x1280x3,腕部图像分辨率达1328x1760x3,帧率为30fps,可完整复现操作过程中的动态细节,避免视觉跟踪的帧差误差。此外,数据集还配套了时间戳(timestamp)、帧索引(frame_index)、剧集索引(episode_index)、索引(index)和任务索引(task_index)多维度索引字段,方便开发者按需截取对应场景的训练数据,大幅降低数据预处理成本。存储方面,数据集结构化内容采用行业通用的parquet文件格式存储,总结构化数据文件大小为100MB,配套视频文件大小为200MB,整体轻量化设计适配本地训练、云训练多种部署模式,对应适配机器人类型为so_follower,兼容LeRobot v3.0版本代码库,开发者可直接接入现有训练流程,无需额外做格式适配。

从应用价值来看,该数据集主要面向机器人视觉跟随、关节运动控制两大核心领域的研发需求,典型应用方向包括:一是工业协作机器人的示教跟随训练,开发者可基于双视角视觉数据+关节同步标注数据,训练机器人复现人类操作者的操作动作,实现无代码化的工业产线快速部署;二是服务机器人的动态跟随功能研发,前视全局视角数据可用于训练机器人识别跟随目标、规避路径障碍,腕部视角数据可支撑近距离交互场景下的精细化动作控制;三是机器人控制算法的基准测试,标准化的标注数据和统一的框架适配性,可作为不同跟随控制算法效果对比的统一测试集,降低行业研发的验证成本。本次数据集的开源发布,进一步丰富了机器人领域的公共训练资源池,对降低中小研发团队的准入门槛、推动跟随类机器人技术的落地应用具有积极意义。

查看eval_2cameras_container_21_18

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们