越南FPT软件AI中心 本次发布的数据集 SWE-Synth, SWE-Synth是一个由越南FPT软件AI中心提出的、基于大型语言模型的合成数据集生成框架。该框架生成的数据集包含了缺陷代码和相应的修复代码对,以及用于验证缺陷和修复正确性的测试用例。这些数据集是在代码库级别上合成的,能够模拟真实的软件开发过程中出现的缺陷。SWE-Synth通过提供可扩展的、包含修复轨迹的合成数据,旨在推动自动程序修复和软件工程自动化领域的研究。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)