中国科学院自动化研究所 本次发布的数据集 Codecfake, Codecfake数据集是由中国科学院自动化研究所创建的大型开放源代码数据集,专注于基于音频语言模型(ALM)的音频检测。该数据集包含超过100万音频样本,涵盖两种语言,并设置了多种测试条件,以评估模型对ALM生成音频的检测能力。数据集的构建涉及多种主流的神经音频编解码模型,旨在通过这些模型生成的伪造音频来训练和验证音频深度伪造检测(ADD)模型。Codecfake数据集的应用领域主要集中在提高对ALM生成音频的检测准确性,解决现有模型在检测新型伪造音频方面的局限性。
关于 中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构,主要从事自动化科学与技术的研究,涵盖人工智能、机器人技术、模式识别等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)