当前大模型在学术科研场景的应用正在快速普及,但科研人员使用大模型查询学术成果时,经常遇到生成内容杜撰引用、偏离原文结论的幻觉问题,不仅大幅降低科研信息检索效率,还可能引发学术结论偏差甚至学术不端风险,面向垂直学术领域的高质量标注数据集,已成为破解这一痛点的核心基础设施支撑。近日,维也纳技术大学联合KR Labs正式发布高质量学术基准数据集ACL-Verbatim,该数据集首发于预印本平台arXiv,主要面向学术抽取式问答、计算语言学文献分析两大核心场景打造。
据公开信息显示,ACL-Verbatim是专为学术研究领域的抽取式问答任务打造的无幻觉解决方案基准数据集,数据源覆盖ACL Anthology库中2026年2月前收录的12万余篇计算语言学与自然语言处理(NLP)领域学术论文。研发团队首先通过PDF转Markdown格式转换、自定义文本分块策略完成原始数据的标准化预处理,后续采用ScIRGen方法生成合成查询,再由NLP领域专业研究人员完成严格的相关性标注与文本跨度标注,最终形成100组经过精细人工校验的查询-文本块对,从数据源、生成逻辑到标注流程全链路保障了数据集的可靠性与专业适配性。
作为垂直学术领域的稀缺标注数据集,ACL-Verbatim的核心作用是为抽取式问答模型提供标准化的训练和评估标的,从数据侧降低大模型在学术问答场景中的幻觉发生率,提升学术信息检索的准确性与结果可解释性。从落地应用前景来看,该数据集可支撑NLP领域智能文献检索工具的性能优化,帮助科研人员快速定位特定研究问题对应的原文结论;可服务于计算语言学领域的文献计量分析,为领域研究脉络梳理、前沿趋势研判提供可信的数据支撑;还可用于开发高效、透明的AI辅助研究工具,覆盖智能文献综述生成、研究成果交叉验证、学术观点溯源等多个科研高频场景。
当前全球AI模型迭代正在从通用场景向垂直细分场景深化,垂直领域的高质量标注数据集已成为AI产业的核心数据要素资源,学术领域由于数据专业性强、标注门槛高,符合科研需求的基准数据集供给长期不足。本次ACL-Verbatim数据集的发布,填补了NLP领域无幻觉抽取式问答基准的空白,也为其他学科的专业学术数据集构建提供了可参考的技术路径,对推动AI辅助科研工具的可信落地、提升科研数字化效率具有重要的行业价值。





_1769672084863.jpg)