剑桥大学本次发布的数据集Semantic Timbre Dataset,语义音色数据集是由剑桥大学创建的针对电吉他的专业音频数据集,包含275,310条单音吉他样本,每条均标注了19种音色描述符(如模糊、明亮)及其强度值。数据来源于EGFxSet原始吉他音色,通过Guitar Rig 7 Pro效果器系统生成不同参数变体,并采用人工标注方式建立音色语义与声学特征的映射关系。该数据集填补了生成式AI在音乐音色控制领域的空白,支持语义音频合成、音色插值等研究,为解决传统音频生成模型缺乏直观语义控制的问题提供了结构化数据基础。
关于剑桥大学,剑桥大学是英国历史悠久的顶尖研究型大学,成立于1209年,位于英格兰剑桥市。作为世界著名的高等教育机构,剑桥大学在多个学科领域享有盛誉,尤其在自然科学、工程技术和人文社科方面具有突出贡献。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)