five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

KU Leuven 发布 DAVE 数据集, 应用在 音频视觉融合、模型评估 领域

五号数据雷达开源数据市场2025-03-14 08:1427
DAVE 是 KU Leuven 发布的数据集,于 2025-03-12 首发在 arXiv 应用于 音频视觉融合、模型评估 领域

KU Leuven 本次发布的数据集 DAVE, DAVE(Diagnostic Audio Visual Evaluation)是一个新颖的基准数据集,由KU Leuven的ESAT-PSI研究机构创建,旨在系统地评估音频视觉模型的性能。该数据集包含2426个样本,通过半自动数据生成方法,利用Epic Kitchens和Ego4D两个数据集生成多选问题和答案。DAVE特别设计的问题需要同时利用音频和视觉模态的信息,以确保单一模态无法正确回答问题。数据集覆盖了多种日常活动和声音事件,通过精确控制视觉动作与合成音频事件的时间对齐,以严格评估音频视觉集成能力。

查看DAVE

README 内容: 

 

关于 KU Leuven , 天主教鲁汶大学,位于比利时,是欧洲最古老且最著名的大学之一。该大学以其高质量的教育和研究而闻名,提供广泛的学科领域,包括人文科学、社会科学、自然科学、工程技术和医学等。天主教鲁汶大学在全球大学排名中一直名列前茅,是国际学术交流和合作的重要中心。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们