以色列理工学院本次发布的数据集LIBERTy (LLM-based Interventional Benchmark for Explainability with Reference Targets),LIBERTy是由以色列理工学院开发的一个基于结构化因果模型的基准数据集,旨在评估大语言模型的概念解释方法的忠实性。该数据集包含三个子集,分别针对疾病检测、简历筛选和工作场所暴力预测等社会挑战领域,通过LLM生成的结构化反事实对构建。数据集通过明确的因果图定义概念关系,并引入新的评估指标——顺序忠实性,以系统分析模型对概念干预的敏感性。LIBERTy为开发更忠实的可解释性方法提供了标准化评估框架,尤其适用于高风险的决策场景。
查看LIBERTy (LLM-based Interventional Benchmark for Explainability with Reference Targets)
README内容:
关于以色列理工学院,以色列理工学院(Technion - Israel Institute of Technology)是以色列最古老的大学之一,位于海法市,以其在工程、科学和技术领域的卓越教育和研究而闻名。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)