随着具身人工智能技术的快速落地,多机器人协同作业正在成为工业巡检、灾害救援、智慧物流等多个垂直场景的核心解决方案,但此前行业始终缺乏针对多智能体同步自我中心视角的协作推理能力评测基准,极大制约了相关技术的标准化迭代。近日,卡尔斯鲁厄理工学院联合湖南大学等多机构共同研发的全球首个多机器人协作视觉问答数据集EgoTeam正式上线arXiv,填补了这一领域的供给空白。
据介绍,EgoTeam数据集核心定位是评估AI模型整合多个移动机器人同步自我中心视频、完成协作空间推理的能力,整体数据集包含超过11.4万条问答对,覆盖19种问题类型、四个难度层级和三种机器人团队规模,素材来源覆盖Habitat、iGibson模拟器环境以及真实世界四足机器人实验场景,总计包含约385.7小时的有效视频素材。在数据生产环节,研发团队首先在模拟环境中部署多机器人团队生成标准化探索轨迹与交互事件,随后结合场景元数据与GPT-4o自动生成问答对,最终通过人工标注校验的方式保障全量数据的质量可控性。
从技术价值来看,EgoTeam数据集主要面向具身人工智能领域的技术研发,专门针对多机器人协同感知、跨视角信息关联、团队级场景理解、动态空间推理等行业共性核心问题提供评测依据,为开发能够感知、理解共享动态环境的多智能体系统提供关键的基准支撑。从应用落地角度来看,该数据集的相关研究成果未来可落地到多个产业场景:在工业巡检场景中,可支撑多机器人协同完成厂区设备、管线的全方位监测,自动识别故障风险并生成排查方案;在应急救援场景中,可帮助多台搜救机器人快速整合废墟内部多视角画面,自动输出生还者位置、建筑结构风险等关键决策信息;在智慧仓储场景中,可优化多AGV机器人的协同调度逻辑,提升拣选效率、降低货物碰撞风险。
当前数据要素已经成为人工智能产业迭代的核心底座,垂直领域高质量数据集的供给能力直接决定了技术落地的效率。EgoTeam数据集的发布,不仅完善了具身AI领域的数据集供给体系,也为多智能体协同技术的标准化研发提供了统一的评测标尺,对推动全球具身人工智能产业从单智能体应用向多智能体协同作业的升级具有重要的行业价值。
首页 / 开源数据市场 / 正文
中德联合机构发布全球首个多机器人协作视觉问答数据集EgoTeam 填补具身AI协同感知评测空白
五号数据雷达开源数据市场2026-05-20 05:4416
卡尔斯鲁厄理工学院联合湖南大学等多机构于2026年5月18日在arXiv首发全球首个多机器人协作视觉问答数据集EgoTeam,该数据集为多机器人协同感知、具身视觉问答等领域提供标准化评测基准,将有效推动具身人工智能技术的迭代与落地。

社区讨论
近期热门




_1769672084863.jpg)