伦敦玛丽女王大学 本次发布的数据集 MusicCaps, MusicCaps数据集是一个用于音乐生成模型评估的基准数据集,包含5521个音乐描述提示,以及由不同音乐生成模型生成的音乐样本。数据集旨在支持对音乐生成模型进行透明、可重复和以人为中心的评估,以更好地反映人类审美判断。该数据集由伦敦玛丽女王大学数字音乐中心的研究团队创建,并通过比较实验评估了五个最先进的音乐生成模型,包括JASCO、Stable-Audio-Open、MusicGen、YuE和DiffRhythm,以了解不同评价方法的差异和偏差。研究结果表明,JASCO在内容有用性和制作质量方面表现出色,而DiffRhythm在制作复杂性方面表现突出。该数据集的发布旨在推动对生成模型进行更全面和系统的评估,以更好地反映人类偏好。
关于 伦敦玛丽女王大学 , 伦敦玛丽女王大学是位于英国伦敦的一所研究型大学,是英国罗素集团成员之一,以其卓越的教学和研究质量著称。数字音乐中心是该大学下属的一个研究机构,专注于音乐与数字技术相结合的领域研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)