作为深耕底层操作系统、高性能计算、嵌入式设备、游戏引擎等核心数字基础设施领域的主流开发语言,C++的性能优化一直是工业界与学术界共同关注的核心命题。此前自动化程序修复(APR)领域的基准数据集大多聚焦功能缺陷修复,针对性能缺陷的标准化验证样本长期稀缺,且多数样本为人工合成案例,与真实开发场景的适配度较低,难以支撑性能修复工具的落地验证,也拖慢了C++生态整体优化效率的提升。
2026年5月12日,苏黎世联邦理工学院正式在预印本平台arXiv发布C++性能修复基准数据集CppPerf-DB,填补了这一领域的空白。据介绍,CppPerf-DB是专门为自动化性能修复领域打造的真实场景基准库,核心目标是为行业提供可执行、可复现的真实性能改进补丁样本,降低相关工具研发与验证的门槛。
该数据集的样本全部来自真实开源生态,共收录347个经过研发人员手动验证的性能优化补丁,全部源自42个行业广泛使用的成熟开源C++代码仓库,覆盖相关项目长达6年的开发迭代历史。样本的多样性高度符合真实开发场景特征:其中39%的补丁涉及多文件修改,单补丁代码变更行数的中位数为28行,覆盖了缓存优化、循环优化、内存管理优化、算法逻辑优化等多种常见的C++性能优化场景。在构建流程上,研究团队通过自研的CppPerf-Mine采集管道从GitHub公开仓库中批量挖掘候选补丁,后续依次经过结构化规则过滤、大语言模型分类标注、容器化环境一致性测试三大环节校验,最终筛选出符合要求的高质量样本,确保所有补丁都具备可复现的性能提升效果。
从落地价值来看,CppPerf-DB的核心应用方向是自动化性能修复工具的效果评估,尤其是针对C++程序执行时间优化类工具的标准化测试,为解决真实开发场景中性能缺陷修复的效果验证难题提供了统一标尺。除此之外,该数据集还可覆盖多个典型应用场景:对于研发自动化代码优化工具、AI编程助手的厂商而言,该数据集可作为训练与验证集,提升工具对C++性能问题的识别与修复准确率;对于深耕C++开发的云服务商、嵌入式设备厂商、游戏引擎团队,可基于该数据集提炼通用性能优化规则,搭建内部的代码性能检测系统,降低资深性能优化工程师的重复劳动;对于软件工程领域的学术研究人员,该数据集也可为性能缺陷模式研究、跨项目性能优化共性规则提炼提供真实样本支撑。
随着大模型在代码开发领域的应用不断深入,高质量的垂直领域基准数据集已经成为软件工程AI工具研发的核心基础设施,本次CppPerf-DB的发布,也将进一步推动自动化程序修复领域从功能缺陷修复向性能优化方向拓展,助力整个C++开发生态的提质增效。





_1769672084863.jpg)