AISE research lab at TU Delft本次发布的数据集multilingual-code-comments-fixed-4,该数据集包含五种语言(中文、荷兰语、英语、希腊语、波兰语)的代码文件及其注释,旨在评估不同AI模型在代码注释生成任务上的表现。每个语言配置包含500个样本,主要字段包括文件ID、代码内容、仓库信息、文件路径、原始注释,以及多个AI模型(如Qwen/CodeQwen1.5-7B、bigcode/starcoder2-7b等)生成的掩码数据、预测结果和预测注释。此外,还包含专家准确率和错误代码等评估指标。数据集适用于代码生成模型评估、多语言代码注释研究等场景。
查看multilingual-code-comments-fixed-4
关于AISE research lab at TU Delft,AISE research lab at TU Delft是荷兰代尔夫特理工大学的一个研究实验室,专注于开发和应用机器学习模型于软件工程领域。
关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。





_1769672084863.jpg)