five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

AISE research lab at TU Delft发布multilingual-code-comments-fixed-4数据集,应用在代码注释生成、多语言处理领域

五号数据雷达开源数据市场2026-03-11 03:0619
multilingual-code-comments-fixed-4是AISE research lab at TU Delft发布的数据集,于2026-03-10首发在HuggingFace应用于代码注释生成、多语言处理领域

AISE research lab at TU Delft本次发布的数据集multilingual-code-comments-fixed-4,该数据集包含五种语言(中文、荷兰语、英语、希腊语、波兰语)的代码文件及其注释,旨在评估不同AI模型在代码注释生成任务上的表现。每个语言配置包含500个样本,主要字段包括文件ID、代码内容、仓库信息、文件路径、原始注释,以及多个AI模型(如Qwen/CodeQwen1.5-7B、bigcode/starcoder2-7b等)生成的掩码数据、预测结果和预测注释。此外,还包含专家准确率和错误代码等评估指标。数据集适用于代码生成模型评估、多语言代码注释研究等场景。

查看multilingual-code-comments-fixed-4

关于AISE research lab at TU Delft,AISE research lab at TU Delft是荷兰代尔夫特理工大学的一个研究实验室,专注于开发和应用机器学习模型于软件工程领域。

关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们