首页 / 开源数据市场 / 正文

中国科学院自动化研究所发布 Codecfake 数据集, 应用在音频伪造检测、深度学习领域

五号数据雷达开源数据市场2024-10-13 10:41108

Codecfake 是中国科学院自动化研究所发布的数据集,于 2024-05-15 首发在 arXiv 应用于音频伪造检测、深度学习领域

中国科学院自动化研究所本次发布的数据集 Codecfake, Codecfake数据集是由中国科学院自动化研究所创建的大型开放源代码数据集，专注于基于音频语言模型（ALM）的音频检测。该数据集包含超过100万音频样本，涵盖两种语言，并设置了多种测试条件，以评估模型对ALM生成音频的检测能力。数据集的构建涉及多种主流的神经音频编解码模型，旨在通过这些模型生成的伪造音频来训练和验证音频深度伪造检测（ADD）模型。Codecfake数据集的应用领域主要集中在提高对ALM生成音频的检测准确性，解决现有模型在检测新型伪造音频方面的局限性。

查看Codecfake

关于中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构，主要从事自动化科学与技术的研究，涵盖人工智能、机器人技术、模式识别等多个领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

中国科学院自动化研究所 发布 Codecfake 数据集, 应用在 音频伪造检测、深度学习 领域

社区讨论

中国科学院自动化研究所发布 Codecfake 数据集, 应用在音频伪造检测、深度学习领域