随着大模型技术向任务式交互、多智能体协作方向快速演进,多轮对话场景下的工具调用准确率、动态授权安全性已经成为制约AI代理规模化落地的核心瓶颈,行业对垂直领域高质量评测数据集的需求持续攀升。当前公开数据集大多聚焦单轮工具调用的匹配效果评测,缺乏对多轮交互上下文关联、动态权限授权场景的覆盖,无法满足分布式智能体协作场景的技术研发与验证需求。
近日,思科系统正式发布ASTRA扩展数据集及配套对话工具数据集,该系列数据集于2026年5月4日首发于学术预印本平台arXiv,主要应用于多轮对话工具调用、语义授权框架两大核心领域。其中ASTRA扩展数据集由思科系统技术团队牵头构建,专门聚焦多轮对话场景下的工具调用语义对齐问题,包含大量自然语言任务与MCP服务器工具的标注配对数据,可支撑相关模型完成上下文感知的工具匹配能力训练与评测。配套的对话工具数据集则通过种子生成方法构建,全面覆盖多轮交互中相关与无关工具调用的各类对话样本,可用于评估任务-工具语义匹配模型的精确率与召回率,还原真实业务场景中可能出现的需求模糊、工具错配等边缘情况。
该系列数据集的生成流程结合了人工标注的专业准确性与合成技术的场景覆盖广度,核心目标是解决分布式智能体协作中的动态授权安全挑战,为连续代理语义授权(CASA)框架的技术迭代、效果验证提供标准化的基准测试支持。从典型应用方向来看,该数据集可广泛应用于多个AI落地场景的技术研发:在企业级智能客服场景中,可用于优化多轮交互下的工单系统、知识库、业务办理工具的调用匹配精度,降低用户需求理解误差;在办公智能代理场景中,可为多SaaS工具联动的任务执行提供语义授权校验的测试基准,避免智能代理越权访问敏感业务数据;在工业互联网、智慧城市等分布式智能体集群部署场景中,可支撑多代理协作的动态权限分配机制研发,提升跨节点协作的安全性。
作为全球领先的网络安全与数字化解决方案提供商,思科本次发布的专业数据集,填补了多轮对话语义授权领域的基准测试空白,对于推动连续代理语义授权(CASA)框架的技术迭代与行业标准化具有重要支撑作用。在数据要素作为数字经济核心生产要素的当下,垂直领域高质量评测数据集的开放,将有效降低相关技术的研发门槛,加速AI智能体从实验室走向规模化商用的进程。





_1769672084863.jpg)