five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

萨斯喀彻温大学 发布 GPTCloneBench 数据集, 应用在 语义克隆、软件工程 领域

五号数据雷达开源数据市场2024-10-12 13:5999
GPTCloneBench 是 萨斯喀彻温大学 发布的数据集,于 2023-09-02 首发在 arXiv 应用于 语义克隆、软件工程 领域

萨斯喀彻温大学 本次发布的数据集 GPTCloneBench, GPTCloneBench是由萨斯喀彻温大学计算机科学系创建的一个综合性的语义克隆和跨语言克隆数据集。该数据集通过利用SemanticCloneBench和OpenAI的GPT-3模型,从79,928个克隆对中筛选出37,149个真实的语义克隆对、19,288个错误语义克隆对和20,770个跨语言克隆对。数据集的创建过程包括使用GPT-3模型生成克隆,随后进行手动验证、功能测试和自动验证,确保克隆对的质量。GPTCloneBench的应用领域主要集中在软件工程中,旨在解决语义克隆和跨语言克隆的检测问题,为机器学习模型提供训练数据,以提高克隆检测工具的准确性和效率。

查看GPTCloneBench

关于 萨斯喀彻温大学 , 萨斯喀彻温大学(University of Saskatchewan)是加拿大一所公立研究型大学,位于萨斯喀彻温省的萨斯卡通市。该校成立于1907年,提供广泛的本科、研究生和博士课程,涵盖农业、工程、法律、医学、兽医学、科学和艺术等多个领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们