中国科学院本次发布的数据集Suno70k,Suno70k是由中国科学院团队构建的大规模开源AI歌曲数据集,包含7万条高质量音乐样本,配备增强标签与歌词注释。该数据集通过系统化采集和标注流程构建,旨在解决全曲生成领域缺乏开源高质量数据的问题,为覆盖歌曲生成、音乐风格迁移等研究提供基础支持。其多维度标注特性特别适用于需要旋律控制与歌词同步的生成任务,推动了AI音乐创作的边界扩展。
README内容:
关于中国科学院,中国科学院是中国自然科学最高学术机构、科学技术最高咨询机构、自然科学与高技术综合研究发展中心,成立于1949年11月。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)