five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION eV发布laion-tunes数据集,应用在AI生成音乐、音频分析领域

五号数据雷达开源数据市场2026-02-28 19:0231
laion-tunes是LAION eV发布的数据集,于2026-02-26首发在HuggingFace应用于AI生成音乐、音频分析领域

LAION eV本次发布的数据集laion-tunes,LAION-Tunes 是一个包含 908,174 首 AI 生成音乐曲目的数据集,这些音乐来自 5 个不同的平台(Mureka、Suno、Udio、Riffusion 和 Sonauto)。数据集提供了丰富的元数据、注释和嵌入向量,包括音乐标题、标签、流派、情绪、时长、播放次数、点赞次数等。此外,数据集还包含由 Music-Whisper 生成的音乐描述、Parakeet ASR 的语音转文字内容、768 维的句子嵌入向量、Whisper 音频嵌入向量、美学评分(如连贯性、音乐性、记忆性、清晰度和自然度)以及 NSFW 安全标签。数据集适用于音频分类、文本到音频转换、特征提取等任务,并提供了预构建的搜索索引(FAISS 向量索引和 BM25 文本索引)以支持快速检索。数据集不包含音频文件本身,但提供了指向原始音频文件的 URL。

查看laion-tunes

关于LAION eV,LAION是一个专注于构建大规模图像-文本对数据集的开源项目。

关于HuggingFace,Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们