马里兰大学本次发布的数据集AUDITA,AUDITA是由马里兰大学等机构联合开发的大规模音频问答基准数据集,旨在通过真实世界音频片段和人类编写的 trivia 问题,评估听觉推理能力。该数据集包含9,690条高质量问答对,音频平均时长达36.98秒,涵盖音乐识别、环境声辨识等6大领域。数据源自Quizmasters网站等公开资源,经过严格的对齐清洗和分类标注,特别设计了具有干扰项的多选题形式。该数据集主要应用于测试AI系统在需要多线索推理和长时程依赖的复杂音频理解任务中的表现,揭示了当前模型与人类在听觉认知方面存在的显著差距。





_1769672084863.jpg)