香港浸会大学 本次发布的数据集 FACT-AUDIT, FACT-AUDIT是一个自适应多代理框架,用于动态评估大型语言模型的事实核查能力。该框架利用重要性抽样原则和多代理协作,生成自适应和可扩展的数据集,执行迭代模型中心评估,并根据模型特定响应更新评估。通过结合证明生成和裁决预测,该框架提供了对LLM事实推理能力的全面和演变的审计,以调查其可信度。
关于 香港浸会大学 , 香港浸会大学是一所位于中国香港的公立研究型大学,成立于1963年,是香港八大高校之一。大学提供多个学科的本科及研究生课程,并以其商学、中医学及药剂学课程著称。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。




_1769672084863.jpg)