当前具身智能产业正处于从实验室研发向商业化落地过渡的关键阶段,机器人操作控制精度、视觉伺服响应速度等核心能力的迭代,高度依赖覆盖真实操作场景、标注体系完善的多模态训练数据。作为AI研发的核心基础设施,高质量垂直领域数据集的供给不足,一直是制约机器人通用化能力升级、降低研发门槛的核心瓶颈之一。近日,robot-learning正式对外发布Ex2_PoV1_atpt_0机器人学习专用数据集,该数据集于2026年5月16日首发于全球知名AI开源社区HuggingFace,主要面向机器人操作控制、视觉伺服学习两大核心研发场景提供训练数据支撑。
据了解,本次发布的Ex2_PoV1_atpt_0数据集基于LeRobot框架创建,覆盖机器人学习任务所需的全链路特征维度:既包含动作、状态观测等结构化运动数据,也包含前视图像等视觉感知数据,具体字段覆盖肩部平移、肩部提升、肘部弯曲等全链条机器人关节位置数据,以及抓取器位置数据,可支撑从视觉输入到动作输出的端到端模型训练。存储层面,结构化数据采用行业通用的parquet格式存储,视频数据以MP4格式存储,帧率为30fps,同时数据集配套完整的元数据信息,包括总集数、总帧数、任务索引等,整体结构标准化程度高,可适配主流机器人学习框架的训练需求,适用于各类机器人控制算法与视觉任务研发。
从应用场景来看,该数据集可支撑多类具身智能研发需求:在工业机器人领域,可用于训练分拣、装配场景下的高精度操作控制模型,优化机器人关节运动的流畅度与抓取动作的准确率;在服务机器人领域,可支撑动态场景下的视觉伺服算法研发,提升机器人避障、路径动态调整、人机协作场景下的实时响应能力;此外,标准化的数据集结构也为机器人学习领域的算法复现、横向对比提供了统一基准,有助于降低中小研发团队的原始数据采集成本,推动整个领域的技术迭代效率提升。





_1769672084863.jpg)