首页 / 开源数据市场 / 正文

aaawangge发布多视角机器人同色积木分拣强化学习数据集上线HuggingFace赋能具身智能研发

五号数据雷达开源数据市场2026-04-30 00:108

开发者aaawangge于2026年4月29日在HuggingFace首发so101_place_block_next_to_same_color_4cam_rl_1专用数据集，覆盖多视角视觉观测、动作标注、任务索引等核心维度，可为具身智能机器人视觉操作、强化学习模型训练提供高质量标准化训练素材。

当前具身智能产业进入快速落地期，机器人自主操作、复杂场景任务执行能力的提升高度依赖高质量场景化训练数据集，尤其同时覆盖多视角视觉感知、动作反馈、任务全流程标注的强化学习专用数据，是当前制约机器人泛化操作能力提升的核心供给短板。近日，开发者aaawangge正式发布so101_place_block_next_to_same_color_4cam_rl_1数据集，瞄准机器人视觉操作、强化学习任务执行领域的核心数据需求，为相关研发提供了新的开源数据选择。

aaawangge本次发布的数据集虽然未提供官方直接描述，但通过分析Dataset Structure部分和meta/info.json中的元数据可以推断，这是一个基于HuggingFace旗下LeRobot具身智能开发框架创建的机器人专用数据集，适配bi_so_follower类型机器人。该数据集包含301个完整任务回合（episodes），总计115521帧标注数据，核心内容覆盖动作和观察数据（包括机器人本体状态、多个摄像头角度同步采集的图像数据）、策略动作、人工干预记录等补充信息，同时配备用于跟踪帧、任务回合、任务类型的各类索引，方便研发人员按需提取对应维度数据。存储层面，结构化数据采用大数据领域通用的parquet列式存储格式，读取效率远高于传统文件格式，可直接适配主流AI训练框架的数据调用要求，同时配套分辨率为480x640、30fps的原始视频文件，满足多维度研发需求。

作为面向同色积木分拣放置场景的专用数据集，该类数据的典型应用方向十分广泛：一是可用于具身智能机器人的视觉感知模型训练，多视角同步采集的图像数据可帮助模型提升动态场景下的物体识别、空间定位精度，降低视角变化带来的识别误差；二是可用于强化学习策略训练，完整的动作-观测序列搭配人工干预记录，可用于优化机器人分拣、码放等精细化操作任务的决策效率，降低复杂场景下的任务失败率；三是可支撑机器人仿真到真实环境的迁移（Sim2Real）研究，真实环境采集的场景数据可为仿真模型优化、泛化能力验证提供对照基准。此次垂直场景高质量数据集的开源，也将进一步降低中小团队研发具身智能操作能力的门槛，推动工业分拣、家政服务等场景的机器人落地速度，为数据要素市场中AI训练数据的垂直化、场景化供给提供参考样本。

查看so101_place_block_next_to_same_color_4cam_rl_1

Dataset card内容：

Files and versions内容：

社区讨论

近期热门

aaawangge发布多视角机器人同色积木分拣强化学习数据集 上线HuggingFace赋能具身智能研发

Dataset card内容：

Files and versions内容：

社区讨论

aaawangge发布多视角机器人同色积木分拣强化学习数据集上线HuggingFace赋能具身智能研发