KU Leuven 本次发布的数据集 DAVE, DAVE(Diagnostic Audio Visual Evaluation)是一个新颖的基准数据集,由KU Leuven的ESAT-PSI研究机构创建,旨在系统地评估音频视觉模型的性能。该数据集包含2426个样本,通过半自动数据生成方法,利用Epic Kitchens和Ego4D两个数据集生成多选问题和答案。DAVE特别设计的问题需要同时利用音频和视觉模态的信息,以确保单一模态无法正确回答问题。数据集覆盖了多种日常活动和声音事件,通过精确控制视觉动作与合成音频事件的时间对齐,以严格评估音频视觉集成能力。
README 内容:
关于 KU Leuven , 天主教鲁汶大学,位于比利时,是欧洲最古老且最著名的大学之一。该大学以其高质量的教育和研究而闻名,提供广泛的学科领域,包括人文科学、社会科学、自然科学、工程技术和医学等。天主教鲁汶大学在全球大学排名中一直名列前茅,是国际学术交流和合作的重要中心。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)