首页 / 开源数据市场 / 正文

AISE research lab at TU Delft发布multilingual-code-comments-fixed-4数据集,应用在代码注释生成、多语言处理领域

五号数据雷达开源数据市场2026-03-11 03:0619

multilingual-code-comments-fixed-4是AISE research lab at TU Delft发布的数据集,于2026-03-10首发在HuggingFace应用于代码注释生成、多语言处理领域

AISE research lab at TU Delft本次发布的数据集multilingual-code-comments-fixed-4,该数据集包含五种语言（中文、荷兰语、英语、希腊语、波兰语）的代码文件及其注释，旨在评估不同AI模型在代码注释生成任务上的表现。每个语言配置包含500个样本，主要字段包括文件ID、代码内容、仓库信息、文件路径、原始注释，以及多个AI模型（如Qwen/CodeQwen1.5-7B、bigcode/starcoder2-7b等）生成的掩码数据、预测结果和预测注释。此外，还包含专家准确率和错误代码等评估指标。数据集适用于代码生成模型评估、多语言代码注释研究等场景。

查看multilingual-code-comments-fixed-4

关于AISE research lab at TU Delft,AISE research lab at TU Delft是荷兰代尔夫特理工大学的一个研究实验室，专注于开发和应用机器学习模型于软件工程领域。

关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。

社区讨论

近期热门