中山大学 本次发布的数据集 RepoTransBench, RepoTransBench是一个大规模的真实世界代码翻译基准数据集,由中山大学等机构创建。该数据集包含100个真实代码仓库样本,旨在评估从一种编程语言到另一种编程语言的完整代码仓库翻译能力。数据集的创建过程包括从The Stack和The Stack v2中收集真实仓库,筛选符合条件的仓库,并通过LLM和人工协作构建自动测试套件。RepoTransBench的应用领域主要集中在代码翻译工具的性能评估,旨在解决现有细粒度代码翻译基准无法准确反映真实开发需求的问题。
关于 中山大学 , 中山大学是一所综合性大学,致力于培养高等学历人才和推动科技文化发展,涵盖了哲学、文学、历史学、经济学、管理学、医学、政治学、法学、生物学、理工类和语言学等多个学科领域,提供从高等专科到博士研究生的全方位学历教育。在数据领域,中山大学也取得了显著进展,其天河二号超算服务和星光超算应用平台的数据产品于2023年7月6日在广州数据交易所成功挂牌,这标志着中山大学在数据科技和超算服务方面的实力和成果得到了市场的认可,为相关领域的研究和应用提供了强有力的支持。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)