近年具身智能赛道持续升温,机器人操作学习、视觉伺服控制等核心技术的迭代高度依赖高质量、多维度的实机采集数据集,但当前开源领域覆盖双臂机械臂全关节参数、多视角视觉匹配数据的标准化数据集供给相对稀缺,成为中小研发团队降低研发门槛、加速模型迭代的核心阻碍。近日,开发者juyoungggg正式发布专为机器人学任务设计的0524_setting_2nd_1_edited数据集,该数据集于2026年5月24日首发于全球最大的AI模型与数据集共享平台HuggingFace,采用Apache 2.0开源许可证,支持商用二次开发,为具身智能领域的研发人员提供了新的高质量数据选择。
据介绍,该数据集基于LeRobot框架创建,LeRobot是HuggingFace推出的专为机器人学习设计的开源工具链,可实现机器人操作数据的标准化采集、标注与处理,保障了数据集的格式统一性与跨平台可用性。本次发布的数据集共包含28个操作情节,累计采集28422帧数据,采集帧率为30fps,整体存储分为100MB的parquet结构化数据文件与200MB的视频文件,便于研发人员按需调用不同类型数据开展训练。
从数据维度来看,该数据集的核心特征分为动作(action)与观察(observation)两大模块:其中动作维度包含12个浮点参数,完整对应左右双臂的全部关节位置,覆盖肩部平移、肩部提升、肘部弯曲、腕部弯曲、腕部滚动和夹爪位置六大核心关节动作;观察维度则包含与动作维度一一对应的12个关节位置状态数据,以及来自左腕摄像头、右腕摄像头、右顶部摄像头三个机位的480x640分辨率RGB视频数据,多视角的视觉数据与关节参数的实时匹配,充分满足了视觉伺服控制等场景对多模态数据对齐的要求。此外数据集还包含时间戳、帧索引、情节索引、任务索引等完整元数据,目前仅开放训练分割(0:28)供研发使用。
从应用价值来看,该数据集可广泛应用于机器人操作学习、视觉伺服控制两大核心领域的研发工作:典型应用场景包括双臂协作装配、分拣任务的动作预测模型训练,多视角视觉输入下的机械臂姿态校准算法迭代,跨场景具身智能大模型的推理能力验证等,有效降低了研发团队自行采集实机操作数据的时间与硬件成本。当前我国数据要素市场正加快向垂直科技领域渗透,具身智能作为人工智能落地的核心方向之一,高质量训练数据集的开源供给,将进一步加速核心技术的商业化落地进程,推动机器人领域的普惠式创新。





_1769672084863.jpg)