five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Meta AI Research 发布 EmphAssess 数据集, 应用在 语音处理、模型评估 领域

五号数据雷达开源数据市场2024-10-13 15:4528
EmphAssess 是 Meta AI Research 发布的数据集,于 2023-12-22 首发在 arXiv 应用于 语音处理、模型评估 领域

Meta AI Research 本次发布的数据集 EmphAssess, EmphAssess数据集是由Meta AI Research和法国多家研究机构共同创建的,专注于评估语音到语音模型在处理和再现语音强调方面的能力。该数据集包含3652个合成语音样本,每个样本至少包含一个强调词,并附有详细的元数据,如转录文本和强调词的位置索引。数据集的创建过程涉及从内部文本到语音目的的手写转录本中选择转录本,并确保每个句子至少有两个不同版本的强调。EmphAssess数据集主要用于英语和西班牙语的语音到语音模型评估,旨在解决模型在跨语言和跨说话人转换中准确捕捉和再现强调的问题。

查看EmphAssess

README 内容: 

 

关于 Meta AI Research , Meta AI Research 是 Meta(前身为 Facebook)旗下的一个专注于人工智能研究的部门,致力于推动人工智能技术的前沿研究和应用。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们