five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

aaawangge发布多视角机器人同色积木分拣强化学习数据集 上线HuggingFace赋能具身智能研发

五号数据雷达开源数据市场2026-04-30 00:108
开发者aaawangge于2026年4月29日在HuggingFace首发so101_place_block_next_to_same_color_4cam_rl_1专用数据集,覆盖多视角视觉观测、动作标注、任务索引等核心维度,可为具身智能机器人视觉操作、强化学习模型训练提供高质量标准化训练素材。

当前具身智能产业进入快速落地期,机器人自主操作、复杂场景任务执行能力的提升高度依赖高质量场景化训练数据集,尤其同时覆盖多视角视觉感知、动作反馈、任务全流程标注的强化学习专用数据,是当前制约机器人泛化操作能力提升的核心供给短板。近日,开发者aaawangge正式发布so101_place_block_next_to_same_color_4cam_rl_1数据集,瞄准机器人视觉操作、强化学习任务执行领域的核心数据需求,为相关研发提供了新的开源数据选择。

aaawangge本次发布的数据集虽然未提供官方直接描述,但通过分析Dataset Structure部分和meta/info.json中的元数据可以推断,这是一个基于HuggingFace旗下LeRobot具身智能开发框架创建的机器人专用数据集,适配bi_so_follower类型机器人。该数据集包含301个完整任务回合(episodes),总计115521帧标注数据,核心内容覆盖动作和观察数据(包括机器人本体状态、多个摄像头角度同步采集的图像数据)、策略动作、人工干预记录等补充信息,同时配备用于跟踪帧、任务回合、任务类型的各类索引,方便研发人员按需提取对应维度数据。存储层面,结构化数据采用大数据领域通用的parquet列式存储格式,读取效率远高于传统文件格式,可直接适配主流AI训练框架的数据调用要求,同时配套分辨率为480x640、30fps的原始视频文件,满足多维度研发需求。

作为面向同色积木分拣放置场景的专用数据集,该类数据的典型应用方向十分广泛:一是可用于具身智能机器人的视觉感知模型训练,多视角同步采集的图像数据可帮助模型提升动态场景下的物体识别、空间定位精度,降低视角变化带来的识别误差;二是可用于强化学习策略训练,完整的动作-观测序列搭配人工干预记录,可用于优化机器人分拣、码放等精细化操作任务的决策效率,降低复杂场景下的任务失败率;三是可支撑机器人仿真到真实环境的迁移(Sim2Real)研究,真实环境采集的场景数据可为仿真模型优化、泛化能力验证提供对照基准。此次垂直场景高质量数据集的开源,也将进一步降低中小团队研发具身智能操作能力的门槛,推动工业分拣、家政服务等场景的机器人落地速度,为数据要素市场中AI训练数据的垂直化、场景化供给提供参考样本。

查看so101_place_block_next_to_same_color_4cam_rl_1

Dataset card内容:

Files and versions内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们