five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 正文

【五号雷达-数据快讯】Audio Dialogues - 促进音频与音乐理解的多轮对话数据集

五号雷达2024-04-12 13:2133
Audio Dialogues的推出,为音频理解领域的研究提供了宝贵的资源,可用于训练和评估音频增强的大型语言模型。

Audio Dialogues是英伟达构建的一个多轮对话数据集,旨在提升音频和音乐理解能力。数据集包含163.8K个样本,涵盖通用声音和音乐,除了对话外,该数据集还包括问题-答案对,以理解和比较多个输入音频。该数据集通过基于提示的方法和大型语言模型生成,研究人员首先从AudioSet和MusicCaps这两个数据集中获取音频的注释,然后使用GPT-4模型根据这些注释生成多轮对话。Audio Dialogues的推出,为音频理解领域的研究提供了宝贵的资源,可用于训练和评估音频增强的大型语言模型。

详情请参见五号雷达:https://www.5radar.com/result?key=Audio+Dialogues

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们