国防科技大学 本次发布的数据集 CodeSearchNet, CodeSearchNet是一个广泛应用于代码智能任务的数据集。该数据集通过将原始的人类编写的注释替换为大型语言模型生成的注释,重建了数据集,从而提高了代码模型的预训练数据质量。这一方法通过使用大型语言模型生成的注释,提高了代码总结、代码生成、代码翻译等任务的性能,为代码智能任务的训练数据提供了新的思路。
关于 国防科技大学 , 国防科技大学是中国的一所综合性国家重点大学,位于湖南省长沙市,主要承担国防科技人才培养和科学研究任务,其计算机学院在计算机科学与技术领域有显著的研究成果和学术影响力。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)