中山大学 本次发布的数据集 RustRepoTrans, RustRepoTrans是由中山大学珠海校区创建的第一个面向Rust的代码翻译基准数据集,包含375个任务,涵盖了实际软件开发中的复杂依赖关系。数据集通过从GitHub上选取重写为Rust的项目,提取功能等价的代码对及其依赖关系和测试用例构建而成。创建过程中采用了静态代码分析工具和LLM进行功能等价性验证,并手动校验依赖关系,确保数据集的高质量。该数据集主要用于评估大型语言模型在复杂代码翻译任务中的性能,旨在解决现有基准数据集在处理真实世界软件开发复杂性方面的不足。
关于 中山大学 , 中山大学是中国的一所著名综合性大学,位于广东省广州市,是中国教育部直属的重点大学之一。学校设有多个校区,珠海校区是其重要组成部分,主要开展本科和研究生教育。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)