当前,全球数字经济的深化发展对网络基础设施的稳定性提出了更高要求,作为承载数据流通、业务运转的核心底座,现代网络的节点规模、协议复杂度持续攀升,行业普遍认为,超7成网络故障来源于配置错误,而传统人工排查、规则化运维工具面对超大规模组网场景时,普遍存在响应慢、错漏率高、适配性不足的痛点。近两年,大语言模型在垂直行业的落地进程加速,智能运维(AIOps)成为网络领域的重点探索方向,不少科研机构、运营商、科技企业均在研发基于大模型的网络故障诊断与自动修复方案,但长期以来,该领域缺乏覆盖复杂真实场景的统一基准测试数据集,不同技术方案的能力难以实现横向对齐,一定程度上阻碍了技术的落地与标准化。
在此背景下,苏黎世联邦理工学院本次发布的数据集Cornetto,是专门面向网络配置修复场景打造的基准测试数据集,共包含231个跨不同拓扑(节点规模覆盖20-754个)和不同协议的复杂错误配置场景。为保障数据集的实用性与严谨性,研发团队采用语法生成和语义约束合成技术构建全部测试用例,既保证了配置的结构合理性,也确保场景与现实网络的运维需求高度匹配;同时,团队通过差分数据平面分析技术完成所有用例的功能正确性验证,避免测试基准本身出现逻辑漏洞。
该数据集的核心应用方向为评估大语言模型在网络自动化运维场景下的故障诊断与配置修复能力,为网络配置错误的可靠修复提供标准化测试框架。从实际应用场景来看,Cornetto首先可为网络领域的科研工作提供统一的测试标尺,不同机构研发的运维大模型、智能排障工具均可基于该数据集完成准确率、修复成功率、响应速度等核心指标的横向对比,降低学术研究的验证成本;其次可支撑产业端的智能运维方案研发,运营商骨干网、金融数据中心、工业互联网等关键信息基础设施的运维方案,可借助数据集中的复杂错误场景完成模拟测试,提前排查方案漏洞,提升实际部署后的稳定性;此外,该数据集也可为网络配置自动化生成、网络安全攻防演练等相关领域的技术研发提供基础数据支撑。
作为垂直领域的高价值基准数据集,Cornetto的发布也为数据要素在人工智能落地场景中的支撑作用提供了典型样本:垂直场景的高质量标注数据集是AI技术标准化、规模化落地的核心底座,这类针对性强、严谨度高的基准数据集的供给,将有效降低相关技术的研发门槛,加速网络自动化运维领域的技术迭代与产业落地。





_1769672084863.jpg)