five
五号数据雷达
资产融资
资源入表
产品交易
知识产权
首页 / 开源数据市场 / 正文

国防科技大学 发布 CodeSearchNet 数据集, 应用在 代码智能、自然语言处理 领域

五号数据雷达开源数据市场2025-05-13 13:2564
CodeSearchNet 是 国防科技大学 发布的数据集,于 2025-04-28 首发在 arXiv 应用于 代码智能、自然语言处理 领域

国防科技大学 本次发布的数据集 CodeSearchNet, CodeSearchNet是一个广泛应用于代码智能任务的数据集。该数据集通过将原始的人类编写的注释替换为大型语言模型生成的注释,重建了数据集,从而提高了代码模型的预训练数据质量。这一方法通过使用大型语言模型生成的注释,提高了代码总结、代码生成、代码翻译等任务的性能,为代码智能任务的训练数据提供了新的思路。

查看CodeSearchNet

关于 国防科技大学 , 国防科技大学是中国的一所综合性国家重点大学,位于湖南省长沙市,主要承担国防科技人才培养和科学研究任务,其计算机学院在计算机科学与技术领域有显著的研究成果和学术影响力。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们