萨斯喀彻温大学 本次发布的数据集 GPTCloneBench, GPTCloneBench是由萨斯喀彻温大学计算机科学系创建的一个综合性的语义克隆和跨语言克隆数据集。该数据集通过利用SemanticCloneBench和OpenAI的GPT-3模型,从79,928个克隆对中筛选出37,149个真实的语义克隆对、19,288个错误语义克隆对和20,770个跨语言克隆对。数据集的创建过程包括使用GPT-3模型生成克隆,随后进行手动验证、功能测试和自动验证,确保克隆对的质量。GPTCloneBench的应用领域主要集中在软件工程中,旨在解决语义克隆和跨语言克隆的检测问题,为机器学习模型提供训练数据,以提高克隆检测工具的准确性和效率。
关于 萨斯喀彻温大学 , 萨斯喀彻温大学(University of Saskatchewan)是加拿大一所公立研究型大学,位于萨斯喀彻温省的萨斯卡通市。该校成立于1907年,提供广泛的本科、研究生和博士课程,涵盖农业、工程、法律、医学、兽医学、科学和艺术等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)