Pontificia Universidad Católica de Chile 本次发布的数据集 Synthetic Dataset for Code Vulnerability Flaws, 本研究提出了一个合成数据集,用于代码漏洞缺陷的代码审查。该数据集由Pontificia Universidad Católica de Chile的研究团队创建,旨在通过利用大型语言模型(LLMs)生成类似人类的代码审查评论,以解决现有数据集中安全相关审查样本不足的问题。数据集的内容基于安全漏洞相关的提交,包括提交的差异和相应的提交消息。研究团队计划使用这个合成数据集来微调现有的代码审查模型,并预期这将提高模型的性能。
查看Synthetic Dataset for Code Vulnerability Flaws
关于 Pontificia Universidad Católica de Chile , 智利天主教大学,成立于1888年,是智利的一所著名私立大学,以其高质量的教育和研究项目在国际上享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)