浙江工业大学 本次发布的数据集 MRSDrama, MRSDrama数据集是首个多模态记录的空间戏剧数据集,包含双耳戏剧音频、剧本、视频、几何姿态和文本提示。数据集包含由21位演讲者在三个场景中录制的97.82小时的语音数据,旨在解决多模态沉浸式空间戏剧生成任务中的数据收集成本高、统一姿态表示提取困难、戏剧韵律和空间沉浸式建模难度大等挑战。该数据集适合各种任务,如双耳定位和戏剧生成,并通过多模态提示生成高质量、连续、多说话人双耳语音,具有戏剧韵律和空间沉浸感。
关于 浙江工业大学 , 浙江工业大学位于浙江省杭州市,是一所以工为主,工、理、管、文、法、经、教育等多学科协调发展的省属重点大学。学校在工程技术领域具有较强的研究实力和教学水平。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)