five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

KnowledgeVerse AI发布kg-hallu-eval数据集,应用在大语言模型、幻觉检测领域

五号数据雷达开源数据市场2025-12-31 19:1765
kg-hallu-eval是KnowledgeVerse AI发布的数据集,于2025-12-29首发在arXiv应用于大语言模型、幻觉检测领域

KnowledgeVerse AI本次发布的数据集kg-hallu-eval,该数据集名为kg-hallu-eval,由KnowledgeVerse AI和eCampus大学联合创建,专注于大语言模型幻觉自检测研究。数据集包含500余条经过人工标注的样本,涵盖现实场景中的受控幻觉案例和真实模型生成内容,数据来源包括人工构造的典型幻觉样本及GPT-4o等模型的原始输出。创建过程通过专家团队对多轮模型响应进行事实核查和标注,确保数据质量。该数据集旨在解决大语言模型在关键应用中产生虚假陈述的问题,为幻觉检测算法提供标准化评估基准,推动可信AI系统的发展。

查看kg-hallu-eval

README内容:

 

关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们