布拉格工业大学 本次发布的数据集 Speaker Characteristics DeepFake (SCDF), SCDF数据集是一个包含超过237,000个话语的丰富注释资源,用于系统地评估人口统计偏差在深度伪造语音检测中的影响。该数据集包含平衡的男性和女性演讲者的代表性,跨越五种语言和广泛的年龄范围。我们评估了几个最先进的检测器,并表明演讲者特征显著影响检测性能,揭示了性别、语言、年龄和合成器类型之间的差异。这些发现强调了需要开发具有偏差意识的检测系统,并为建立非歧视性的深度伪造检测系统奠定了基础。
查看Speaker Characteristics DeepFake (SCDF)
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)