five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

美国密歇根大学 发布 Famous Figures Dataset 数据集, 应用在 音频反欺骗、语音合成 领域

五号数据雷达开源数据市场2025-07-04 10:0839
Famous Figures Dataset 是 美国密歇根大学 发布的数据集,于 2025-07-01 首发在 arXiv 应用于 音频反欺骗、语音合成 领域

美国密歇根大学 本次发布的数据集 Famous Figures Dataset, Famous Figures数据集由美国密歇根大学电气与计算机工程系创建,旨在为政治人物提供高质量的语音合成数据,用于研究和开发音频反欺骗检测系统。数据集包含10位知名政治人物的26,500条真实语音样本和265,000条合成语音样本,平均时长约为8秒。数据集的创建过程涉及从YouTube视频收集高质量音频,使用Assembly AI进行说话人分割,OpenAI Whisper Large Turbo进行转录,并基于转录进行音频分割。合成语音生成采用了多种文本到语音(TTS)系统,包括单说话人模型、少量样本微调和零样本合成。该数据集可用于解决音频欺骗检测问题,保护公众人物免受语音伪造攻击。

查看Famous Figures Dataset

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们