首页 / 开源数据市场 / 正文

印度西尔查尔国家理工学院发布 BMAS English 数据集, 应用在文本检测、生成式AI 领域

五号数据雷达开源数据市场2025-10-08 04:4720

BMAS English 是印度西尔查尔国家理工学院发布的数据集,于 2025-09-26 首发在 arXiv 应用于文本检测、生成式AI 领域

印度西尔查尔国家理工学院本次发布的数据集 BMAS English, BMAS English是一个用于二分类人类和机器文本的英语语言数据集，不仅能够识别机器生成的文本，还可以尝试确定其生成器，并针对减少检测的可检测性的对抗性攻击。数据集包含来自五个广泛应用于现实世界应用的领域的人类撰写的和人工智能生成的文本，包括reddit、新闻文章、维基百科内容、arXiv的科学摘要和通用问答。数据集旨在解决机器生成文本检测的问题，以保护真实性、确保透明度，并最大限度地减少生成式AI的潜在误用。

查看BMAS English

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

印度西尔查尔国家理工学院 发布 BMAS English 数据集, 应用在 文本检测、生成式AI 领域

社区讨论

印度西尔查尔国家理工学院发布 BMAS English 数据集, 应用在文本检测、生成式AI 领域