印度理工学院罗帕尔分校 本次发布的数据集 IndieFake Dataset (IFD), IndieFake数据集(IFD)是一个包含印度英语说话者真实和深度伪造音频的基准数据集。它旨在解决现有数据集中缺乏南亚口音的问题,并包含50名英语说印度人的27.17小时的真实和深度伪造音频。数据集包含11.3小时的真实音频样本和15.82小时的深度伪造音频样本,平均音频样本长度为5秒。IFD具有平衡的数据分布,并包括说话人级别的特征描述,这在ASVspoof21(DF)等数据集中是缺失的。该数据集已被评估用于音频深度伪造检测,并与现有的ASVspoof21(DF)和In-The-Wild(ITW)数据集进行了比较,证明了其有效性。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)