当前,大模型驱动的代码生成技术正逐步成为软件工程领域的核心生产力工具,但现有公开代码数据集多聚焦于静态代码样本的质量标注,缺乏对编码代理动态迭代、进化过程的全链路记录,已成为制约进化编程、自适应代码优化等前沿技术突破的核心数据瓶颈。作为欧洲顶尖的信息学专业研究机构,柏林祖斯研究所长期深耕人工智能、软件工程、数据科学等交叉领域的前沿研究,其多项技术成果已成为全球科技产业的核心支撑。
近日,柏林祖斯研究所联合柏林工业大学等机构正式发布EvoTrace结构化搜索轨迹数据集,相关成果已于2026年5月20日首发于预印本平台arXiv,专门面向进化编程、代码生成优化领域的研究与应用需求。
据介绍,EvoTrace是全球首个面向进化编码代理动态行为分析的规模化公开数据集,本次公开的数据集包含121次完整的进化运行记录,覆盖10672个独特程序、18400次大模型调用,涉及Python数学构造、C++竞技编程两大高频开发场景共16项典型任务。所有数据均采用标准化JSONL格式采集,完整记录了迭代过程中产生的程序源代码、代码版本父子关系图、大模型提示上下文、代码性能评估元数据等全链路信息,支持研究人员完整重放进化编码的全搜索轨迹,可用于拆解进化编码系统在算法结构发现、参数调优、概念重组等不同改进机制中的内在动态特性。
从应用价值来看,EvoTrace数据集的落地应用空间覆盖产学研多个维度:在基础研究层面,研究人员可基于全链路轨迹数据量化分析不同进化策略的效率差异,优化进化编程算法的搜索路径,降低高性能代码生成的算力消耗;在产业应用层面,科技企业可基于该数据集训练大模型的多轮代码优化能力,突破现有大模型仅能生成单轮代码的能力瓶颈,提升复杂编程任务的处理成功率,也可基于轨迹数据开发智能代码调优、自动化Debug等研发工具,大幅降低普通开发者的技术门槛;在教育层面,完整的代码迭代路径也可为编程学习者提供更清晰的解题思路示范,助力计算机学科的实践教学升级。
作为垂直领域的专业科研数据集,EvoTrace的发布不仅填补了进化编码行为分析领域的公开数据供给空白,也为科研类数据集的标准化采集、规范化开放提供了参考范式,对推动人工智能赋能软件工程(AI4SE)领域的产学研协同创新,加速代码生成相关技术从实验室向产业端落地具有重要意义。





_1769672084863.jpg)