伯恩茅斯大学 本次发布的数据集 Emotive Narrative Storytelling (EMNS) corpus, EMNS数据集是由伯恩茅斯大学的数字娱乐中心创建,旨在提升交互式叙事驱动系统中的语音表达性和情感质量。该数据集包含2.3小时的录音,由一名女性演讲者提供,涵盖八种表演情感状态,情感分布均匀,具有0.68%的变异度。数据集还包括表达性水平和自然语言描述,附带单词强调标签。EMNS数据集通过精心选择Mozilla的Common Voice数据集中的句子,确保了语音的多样性和未来扩展的可能性。此外,数据集的创建过程中使用了Montreal Forced Aligner进行语音和文本的对齐,以提高语音合成的自然度和表达性。该数据集适用于语音合成研究,特别是在虚拟助手、交互式故事讲述和娱乐平台等领域,旨在通过合成语音有效传达情感,创造更吸引人的用户体验。
查看Emotive Narrative Storytelling (EMNS) corpus
README 内容:
关于 伯恩茅斯大学 , 伯恩茅斯大学位于英国,是一所知名的公立研究型大学,尤其在媒体与传播、计算机科学和旅游管理等领域享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)