ETH Zurich 本次发布的数据集 AutoAdvExBench, AutoAdvExBench是一个用于评估大型语言模型是否能自主利用对抗样本防御的基准。该数据集包含了51个真实世界的对抗样本防御实现,由ETH Zurich的研究人员创建。数据集涵盖了从arXiv抓取的论文中筛选出的与对抗机器学习相关的防御方法,并通过手动筛选确保了防御方法的多样性和可复现性。数据集旨在解决机器学习安全领域中的实际问题,为评估AI模型在对抗机器学习研究中的应用提供了一种新的、直接的度量方式。
README 内容:
关于 ETH Zurich , ETH苏黎世,全称为瑞士联邦理工学院苏黎世分校,是瑞士的两所联邦理工学院之一。ETH苏黎世在自然科学和工程学领域处于世界领先地位,培养了许多诺贝尔奖得主。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)