LAION eV本次发布的数据集laion-tunes,LAION-Tunes 是一个包含 908,174 首 AI 生成音乐曲目的数据集,这些音乐来自 5 个不同的平台(Mureka、Suno、Udio、Riffusion 和 Sonauto)。数据集提供了丰富的元数据、注释和嵌入向量,包括音乐标题、标签、流派、情绪、时长、播放次数、点赞次数等。此外,数据集还包含由 Music-Whisper 生成的音乐描述、Parakeet ASR 的语音转文字内容、768 维的句子嵌入向量、Whisper 音频嵌入向量、美学评分(如连贯性、音乐性、记忆性、清晰度和自然度)以及 NSFW 安全标签。数据集适用于音频分类、文本到音频转换、特征提取等任务,并提供了预构建的搜索索引(FAISS 向量索引和 BM25 文本索引)以支持快速检索。数据集不包含音频文件本身,但提供了指向原始音频文件的 URL。
关于LAION eV,LAION是一个专注于构建大规模图像-文本对数据集的开源项目。
关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)