西北工业大学 本次发布的数据集 EnvSDD, EnvSDD是一个大规模的环境声音深度伪造检测数据集,包含45.25小时的真声音频和316.74小时的伪造声音频。数据集分为两种深度伪造类型:文本到音频(TTA)和音频到音频(ATA)。数据集从六个真实音频数据集中采样,涵盖了单声道和多声道条件,并使用五个最先进的音频生成模型生成伪造音频。该数据集旨在评估检测模型在不同场景下的泛化能力,包括未见过的生成模型和未见过的数据集。
关于 西北工业大学 , 西北工业大学是中国的一所综合性全国重点大学,位于陕西省西安市,是中国西部高等教育的重点建设大学之一,也是国家首批“211工程”和“985工程”重点支持的大学。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)