罗马大学La Sapienza 本次发布的数据集 MAIA (Multimodal AI Assessment), MAIA是一个为了细粒度地研究视觉语言模型在视频上的推理能力而设计的意大利语基准。它包含12种推理类别,旨在区分语言和视觉关系,评估视觉语言模型在视频相关问题的陈述验证任务和开放性问题回答任务上的性能。该数据集反映了意大利文化和语言,由母语人士制作。
查看MAIA (Multimodal AI Assessment)
关于 罗马大学La Sapienza , 罗马大学La Sapienza是位于意大利罗马的一所综合性大学,成立于1303年,是欧洲最古老的大学之一,以其在科学研究、人文教育等方面的卓越成就而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)