首页 / 开源数据市场 / 正文

Hanoi University of Science and Technology 发布 FAIDSet 数据集, 应用在 AI生成文本检测、多语言文本处理领域

五号数据雷达开源数据市场2025-05-22 11:5330

FAIDSet 是 Hanoi University of Science and Technology 发布的数据集,于 2025-05-20 首发在 arXiv 应用于 AI生成文本检测、多语言文本处理领域

Hanoi University of Science and Technology 本次发布的数据集 FAIDSet, FAIDSet是一个多语言、多领域、多生成器的细粒度AI生成文本检测数据集，包含约8.4万个样本。该数据集涵盖了研究论文摘要、学生论文等学术领域的文本，以及由GPT、Gemini、DeepSeek和Llama等最新LLM家族生成的文本。数据集的创建旨在帮助开发更鲁棒和通用的检测模型，以处理复杂的跨语言协作场景。该数据集可用于训练和评估AI生成文本检测模型，从而提高AI辅助写作的透明度和可追溯性。

查看FAIDSet

README 内容：

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

Hanoi University of Science and Technology 发布 FAIDSet 数据集, 应用在 AI生成文本检测、多语言文本处理 领域

README 内容：

社区讨论

Hanoi University of Science and Technology 发布 FAIDSet 数据集, 应用在 AI生成文本检测、多语言文本处理领域