近年来,具身智能成为全球人工智能领域的研发热点,机械臂自主操作、多视角强化学习作为工业自动化、服务机器人落地的核心支撑技术,其迭代速度高度依赖高质量、多维度的场景训练数据。当前业内面向同色物料归置等细分操作场景的标注数据集供给相对有限,研发团队往往需要投入大量成本自行搭建数据采集环境,一定程度上抬高了技术研发的门槛。
2026年4月29日,技术贡献者aaawangge在全球知名AI开源社区HuggingFace正式首发so101_place_block_next_to_same_color_4cam_rl_0数据集,该数据集由LeRobot打造,专门面向机器人技术相关研发任务设计。
据公开信息显示,该数据集完整覆盖机器人动作与观察两类核心数据:一方面包含左右机械臂各关节的实时位置、夹持器状态等运动学参数,另一方面配套了左左、左上、右前、右右四个不同机位的同步视频数据,可充分满足多视角感知融合算法的训练需求。数据集规模方面,其共包含200个完整训练片段,累计183831帧数据,采样帧率为30fps,可还原连续操作场景下的完整动作链路。存储层面,结构化数据采用行业通用的parquet格式存储,方便研究者快速调用解析;视频部分采用AV1编码,在保留原始画质的前提下大幅降低了存储占用。除此之外,数据集还额外标注了干预标记、策略ID等补充信息,为机器人控制策略优化、强化学习模型迭代等研究提供了更丰富的维度支撑。
从应用场景来看,该数据集可广泛支撑多个细分领域的研发工作:在工业机器人场景,研发团队可基于该数据集训练机械臂的分拣、同色物料归置、码放等高精度操作策略,提升产线自动化水平;在多视角强化学习研究领域,四机位同步数据可用于验证跨视角感知对齐、视觉-动作映射模型的性能,降低研究团队的环境搭建成本;此外数据集还可用于具身智能大模型的微调,提升大模型对机械臂动作的理解精度与决策能力。
此次数据集的开源发布,进一步丰富了全球AI开源社区的机器人领域训练数据供给,为相关领域研究者提供了标准化的训练基准,对推动多视角强化学习技术落地、降低具身智能研发门槛具有积极意义。
查看so101_place_block_next_to_same_color_4cam_rl_0





_1769672084863.jpg)