卡内基梅隆大学 本次发布的数据集 ReasonAQA, ReasonAQA数据集是由卡内基梅隆大学的研究团队创建的,旨在提升小规模音频语言模型在音频和文本上的推理能力。该数据集混合了现有数据集和合成数据,总共包含约56k个音频文件和1M个AQA实例,分为预训练、验证和测试三个部分。数据集来源于AudioCaps和Clotho,这两个数据集都包含了丰富的人类标注的音频描述。ReasonAQA的设计允许研究者在控制数据规模不变的情况下,研究模型设计、数据生成方法和预训练策略对推理性能的影响。
README 内容:
关于 卡内基梅隆大学 , 卡内基梅隆大学是一所位于美国宾夕法尼亚州匹兹堡的私立研究型大学,以其在计算机科学、工程、商学和艺术等领域的卓越教育和研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)