five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北京航空航天大学 发布 RepoDebug 数据集, 应用在 代码调试、大型语言模型 领域

五号数据雷达开源数据市场2025-09-06 10:5619
RepoDebug 是 北京航空航天大学 发布的数据集,于 2025-09-04 首发在 arXiv 应用于 代码调试、大型语言模型 领域

北京航空航天大学 本次发布的数据集 RepoDebug, RepoDebug是一个多任务和多语言的代码调试数据集,涵盖了8种常用编程语言和3种调试任务。该数据集由北京航空航天大学计算机科学与工程学院、华东师范大学、北京理工大学和百度公司的研究人员共同构建,旨在评估大型语言模型在代码调试方面的能力。数据集包含22种不同的错误类型,分为4种主要类型:语法错误、引用错误、逻辑错误和多重错误。每个实例都包含一个有错误的代码文件、错误类型和错误位置的详细信息。RepoDebug数据集可用于评估LLMs在识别、定位和修复代码错误方面的能力,并为LLMs在代码调试领域的进一步研究提供支持。

查看RepoDebug

关于 北京航空航天大学 , 北京航空航天大学(Beihang University)是中国一所以工为主,工、理、管、文、法、经、教育、艺术等多学科协调发展的全国重点大学,是中国首批入选国家“211工程”、“985工程”重点建设的高等学府之一。_simple

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们