莫斯科物理技术学院 本次发布的数据集 PsiloQA, PsiloQA是一个大规模的多语言数据集,包含14种语言的跨度级幻觉标注。该数据集通过一个自动化的三阶段流程构建:使用GPT-4o从Wikipedia生成问题-答案对,在没有上下文的情况下从各种LLM中激发潜在的幻觉答案,并通过与黄金答案和检索到的上下文进行比较,使用GPT-4o自动标注幻觉跨度。PsiloQA在14种语言上评估了各种幻觉检测方法,并展示了跨语言的泛化能力。该数据集为多语言细粒度幻觉检测的发展做出了贡献。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)