本次发布的数据集 ME-FEVER, 该数据集名为ME-FEVER,是为了进行多证据幻觉检测而设计的。它是在原始FEVER数据集的基础上合成的,旨在为模型在实际应用中提供一个更具挑战性的基准。每个实例包含两段完全无关的证据、四段部分相关的证据以及一到三段高度相关的证据。该数据集总规模为3,901个实例,其中2,663个用于训练,1,238个用于测试,任务目标是多证据幻觉检测。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)