中山大学 本次发布的数据集 RustRepoTrans, RustRepoTrans是由中山大学珠海的研究团队创建的第一个针对Rust语言的代码翻译基准数据集。该数据集包含375个任务,涵盖了从其他编程语言(如C++、Java和Python)迁移到Rust的代码翻译任务,并包括相关的依赖关系。数据集的创建过程包括从GitHub项目中提取功能等效的代码对,并通过静态代码分析工具和LLM进行验证。RustRepoTrans旨在解决现有代码翻译数据集在处理复杂依赖和实际开发场景中的不足,特别是在处理Rust这种低资源语言时的挑战。
关于 中山大学 , 中山大学是中国的一所著名综合性大学,位于广东省广州市,是中国教育部直属的重点大学之一。学校设有多个校区,其中珠海校区是其重要组成部分,提供多个学科领域的教育和研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)