Mohamed bin Zayed University of AI 本次发布的数据集 ViMUL-Bench, ViMUL-Bench 是一个多语言视频多模态模型评估基准,旨在测试视频语言模型在14种语言(包括低资源和丰富资源语言)上的跨语言和文化理解能力。该数据集涵盖了15个多样化的领域,包括生活方式、节日、食品、仪式、地标和文化人物等,并包括由本地专家手动验证的8000个样本。ViMUL-Bench 还包括一个由120万个样本组成的多语言视频训练集,并开发了一个名为 ViMUL 的简单多语言视频 LMM,该模型在视频理解方面取得了更好的跨语言和文化性能。
关于 Mohamed bin Zayed University of AI , Mohamed bin Zayed University of AI 是一所位于阿联酋的大学,专注于人工智能领域的研究与教育。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)