five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

中山大学 发布 RepoTransBench 数据集, 应用在 代码翻译、基准测试 领域

五号数据雷达开源数据市场2024-12-25 10:36136
RepoTransBench 是 中山大学 发布的数据集,于 2024-12-24 首发在 arXiv 应用于 代码翻译、基准测试 领域

中山大学 本次发布的数据集 RepoTransBench, RepoTransBench是一个大规模的真实世界代码翻译基准数据集,由中山大学等机构创建。该数据集包含100个真实代码仓库样本,旨在评估从一种编程语言到另一种编程语言的完整代码仓库翻译能力。数据集的创建过程包括从The Stack和The Stack v2中收集真实仓库,筛选符合条件的仓库,并通过LLM和人工协作构建自动测试套件。RepoTransBench的应用领域主要集中在代码翻译工具的性能评估,旨在解决现有细粒度代码翻译基准无法准确反映真实开发需求的问题。

查看RepoTransBench

关于 中山大学 , 中山大学是一所综合性大学,致力于培养高等学历人才和推动科技文化发展,涵盖了哲学、文学、历史学、经济学、管理学、医学、政治学、法学、生物学、理工类和语言学等多个学科领域,提供从高等专科到博士研究生的全方位学历教育。在数据领域,中山大学也取得了显著进展,其天河二号超算服务和星光超算应用平台的数据产品于2023年7月6日在广州数据交易所成功挂牌,这标志着中山大学在数据科技和超算服务方面的实力和成果得到了市场的认可,为相关领域的研究和应用提供了强有力的支持。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们