five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

LAION eV发布voiceclap-data数据集,应用在音频分类、密集字幕生成领域

五号数据雷达开源数据市场2026-05-08 05:199
voiceclap-data是LAION eV发布的数据集,于2026-05-07首发在HuggingFace应用于音频分类、密集字幕生成领域

LAION eV本次发布的数据集voiceclap-data,VoiceCLAP 数据集是一个用于训练音频和密集字幕混合模型的数据集,支持音频分类和特征提取任务。数据集包含多个子集,如 Emolia、LAIONs Got Talent、Majestrino 等,每个子集都有不同的来源和特点。数据以 WebDataset 格式存储,每个样本包含一个 48 kHz 单声道音频文件(.flac)和一个 JSON 文件(包含字幕和元数据)。字幕和属性注释由音频感知的 LLM 自动生成,包括情感、音色、韵律等标签。数据集规模在 1B 到 10B 之间,适用于多语言和语音相关的研究。使用该数据集时需注意伦理问题,避免用于可能重新识别、分析或监视说话者的任务。数据集采用 CC-BY-4.0 许可证,部分子集可能继承上游来源的许可条款。

查看voiceclap-data

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们