five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Physicalairi发布柑橘拾取仿真机器人数据集so101_pick_orange_sim_v2 支撑视觉控制、模仿学习等多场景训练

五号数据雷达开源数据市场2026-05-25 01:348
近日,机器人技术厂商Physicalairi正式发布面向柑橘拾取场景的仿真机器人数据集so101_pick_orange_sim_v2,该数据集首发于HuggingFace平台,覆盖多维度机器人运行状态与双路视觉观测数据,可直接用于机器人视觉控制、模仿学习、强化学习等方向的算法训练,为特种作业机器人研发降本提效。

在全球机器人产业加速向细分场景落地的当下,高质量、场景匹配度高的训练数据集已成为制约机器人算法迭代、产品落地效率的核心生产要素。尤其是农业采摘、精密组装等特种作业场景,真实场景数据采集成本高、极端工况样本覆盖不足,标准化仿真数据集的公开供给,可大幅降低中小研发团队、科研机构的数据筹备成本,有效缩短相关机器人产品的研发周期。近日,机器人技术厂商Physicalairi正式对外发布全新仿真机器人数据集so101_pick_orange_sim_v2,该数据集于2026年5月24日首发于全球主流AI模型与数据集社区HuggingFace,专为机器人拾取类任务的算法训练设计。

据介绍,so101_pick_orange_sim_v2数据集基于LeRobot工具创建——作为HuggingFace推出的开源机器人学习工具链,LeRobot生成的数据集具备广泛的框架兼容性,可直接接入主流机器人学习模型的训练流程。该数据集共包含45个任务序列(episodes)、46278帧有效数据,采集帧率为30fps,全部数据均为训练场景优化设计;适配机器人型号为so101_follower,结构化数据以parquet格式存储,视频数据以mp4格式存储,可降低数据读取与解析成本。数据集的标注特征覆盖机器人全链路运行维度:包括6维浮点数组格式的动作数据(对应机器人关节位置)、同样为6维浮点数组的观察状态数据,以及分别来自手腕摄像头、前置摄像头的两路视觉观测数据(分辨率为480x640、3通道,采用AV1编码压缩,兼顾清晰度与存储效率),同时配套时间戳、帧索引、episode索引、任务索引等维度的标注信息,可完美匹配涉及视觉和状态反馈的机器人任务训练需求。

从行业应用价值来看,该数据集的典型应用方向覆盖多个机器人研发赛道:一是可用于农业采摘机器人的模仿学习训练,基于标准化的柑橘拾取动作与视觉数据,研发团队可快速训练机器人的果实识别、路径规划、柔性抓取能力,无需自行搭建仿真环境采集基础数据;二是可作为机器人视觉控制算法的基准测试数据集,验证不同控制算法在动态视觉反馈场景下的响应精度、稳定性与功耗表现;三是也可用于强化学习模型的环境对齐,为拾取类通用机器人算法的迭代提供标准化的训练基底。此次数据集的公开,也进一步丰富了国内机器人细分场景训练数据集的供给,对推动数据要素在机器人产业的流通应用、降低特种作业机器人研发门槛均有积极意义。

查看so101_pick_orange_sim_v2

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们