首页 / 开源数据市场 / 正文

KnowledgeVerse AI发布kg-hallu-eval数据集,应用在大语言模型、幻觉检测领域

五号数据雷达开源数据市场2025-12-31 19:1765

kg-hallu-eval是KnowledgeVerse AI发布的数据集,于2025-12-29首发在arXiv应用于大语言模型、幻觉检测领域

KnowledgeVerse AI本次发布的数据集kg-hallu-eval,该数据集名为kg-hallu-eval，由KnowledgeVerse AI和eCampus大学联合创建，专注于大语言模型幻觉自检测研究。数据集包含500余条经过人工标注的样本，涵盖现实场景中的受控幻觉案例和真实模型生成内容，数据来源包括人工构造的典型幻觉样本及GPT-4o等模型的原始输出。创建过程通过专家团队对多轮模型响应进行事实核查和标注，确保数据质量。该数据集旨在解决大语言模型在关键应用中产生虚假陈述的问题，为幻觉检测算法提供标准化评估基准，推动可信AI系统的发展。

查看kg-hallu-eval

README内容：

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门