KnowledgeVerse AI本次发布的数据集kg-hallu-eval,该数据集名为kg-hallu-eval,由KnowledgeVerse AI和eCampus大学联合创建,专注于大语言模型幻觉自检测研究。数据集包含500余条经过人工标注的样本,涵盖现实场景中的受控幻觉案例和真实模型生成内容,数据来源包括人工构造的典型幻觉样本及GPT-4o等模型的原始输出。创建过程通过专家团队对多轮模型响应进行事实核查和标注,确保数据质量。该数据集旨在解决大语言模型在关键应用中产生虚假陈述的问题,为幻觉检测算法提供标准化评估基准,推动可信AI系统的发展。
README内容:
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)