随着具身智能与工业机器人领域的快速发展,高标注质量、覆盖真实交互场景的机器人操作数据集,已经成为制约操控算法落地的核心资源之一。不同于仿真生成的训练数据,真实机器人采集的时序状态与多模态传感数据,能够有效提升算法的场景泛化能力,降低sim2real(仿真到真实场景迁移)的适配成本。
近日,开发者bartek-niedzielski正式公开了panda_pick_and_place_40_delta_joint_pos数据集,该数据集于2026年5月15日首发于HuggingFace平台,专门针对Franka Emika Panda协作机器人的拾取放置这一高频应用场景打造,全部数据基于LeRobot框架采集生成,可直接适配主流机器人学习训练框架。
该数据集的结构化程度高,核心构成包含40组完整的拾取放置任务序列、总计11359个标注帧、对应82段实拍传感视频,采集帧率为15fps。标注特征维度覆盖全链路机器人操控需求:既包含观测状态字段(采用8维浮点数组,分别对应Panda机器人q1到q7共7个关节的实时位置参数、以及夹爪的开合状态),也包含对应执行动作的同结构标签字段,同时配套了时间戳、帧索引、任务序列索引等时序定位字段,方便开发者对任务执行全流程进行时序分析。除了关节状态数据外,数据集还同步提供两类视觉传感数据:分别是第三方固定视角拍摄的外部场景图像、机器人手腕端搭载相机拍摄的第一人称视角图像,两类视频分辨率均为480x640、3通道RGB格式,完整还原了任务执行过程中的环境感知输入。数据集整体采用parquet格式存储,在保证数据压缩效率的同时,可兼容主流大数据处理与AI训练框架,大幅降低开发者的数据解析成本。
从应用方向来看,该数据集可广泛应用于多个机器人研发场景:一是协作机器人末端控制算法训练,针对3C产线上下料、物流分拣、科研实验等高频拾取放置需求,真实采集的关节与视觉数据可有效提升算法的真实场景适配能力;二是具身智能多模态Agent训练,同步配套的视觉输入与关节动作标签,可支撑端到端具身模型的研发,实现从视觉感知直接输出操控指令的技术落地;三是机器人安全控制算法验证,精准的时序关节位置数据,可用于协作机器人人机共融场景下的碰撞检测、力控响应逻辑的验证优化;四是工业场景机器人动作路径优化,基于40组完整任务的时序数据,研发人员可对拾取放置动作的路径效率、能耗水平进行分析优化,提升产线机器人的运行效率。
当前全球数据要素市场正处于快速发展阶段,工业与科技领域的高价值垂直数据集是核心的流通资源之一,本次公开的机器人专用数据集,进一步丰富了HuggingFace平台的机器人学习资源矩阵,降低了中小研发团队、科研机构的高质量训练数据获取门槛,对推动机器人操作控制领域的技术迭代、加快拾取放置类应用的商业化落地具有积极意义。
查看panda_pick_and_place_40_delta_joint_pos





_1769672084863.jpg)