five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】StoryTTS - 富有表达性的中文文本到语音数据集

五号雷达开源数据市场2024-04-25 18:5837
该数据集对于希望提升TTS系统表达性的研究人员来说是一个宝贵的资源,它有助于推动TTS技术在表达性方面的研究和发展。

StoryTTS是由上海交通大学构建的一个具有丰富声学和文本表达性的中文文本到语音(TTS)数据集。该数据集包含了61小时的连续且富有韵律的语音,并且配有精确的文字转录和丰富的文本表达性注释。数据源自普通话讲故事节目的录音,通过系统全面的标注框架,研究人员对文本表达性进行了深入分析,定义了五个不同的维度:修辞手法、句子结构、场景、模仿角色和情感色彩,并利用大模型(LLMs)进行批量标注。该数据集对于希望提升TTS系统表达性的研究人员来说是一个宝贵的资源,它有助于推动TTS技术在表达性方面的研究和发展。

详情请参见五号雷达:https://www.5radar.com/result?key=StoryTTS

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们