印度西尔查尔国家理工学院 本次发布的数据集 BMAS English, BMAS English是一个用于二分类人类和机器文本的英语语言数据集,不仅能够识别机器生成的文本,还可以尝试确定其生成器,并针对减少检测的可检测性的对抗性攻击。数据集包含来自五个广泛应用于现实世界应用的领域的人类撰写的和人工智能生成的文本,包括reddit、新闻文章、维基百科内容、arXiv的科学摘要和通用问答。数据集旨在解决机器生成文本检测的问题,以保护真实性、确保透明度,并最大限度地减少生成式AI的潜在误用。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)