武汉大学 本次发布的数据集 BioMCD, BioMCD数据集是一个大规模的基准数据集,包含13660篇撤稿文章和53411篇控制文章。数据集通过筛选Retraction Watch和PubMed数据库中的撤稿文章,并利用PubMed Central数据库获取全文,构建了正负样本集。数据集内容涵盖了健康科学领域的研究论文,旨在用于检测学术不端行为,如数据捏造、数据篡改和抄袭等。数据集的创建过程包括数据筛选、数据清洗、特征提取等步骤,最终构建了一个包含多维特征的数据集。该数据集可用于开发可扩展、可解释的工具,以保护研究诚信。
关于 武汉大学 , 武汉大学是中国中部地区的高等学府,位于湖北省武汉市,是直属于教育部的全国重点大学,也是国家“211工程”和“985工程”重点建设的大学之一。学校拥有多个学科领域的研究实力,在国内外享有较高声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)