斯图加特大学 本次发布的数据集 VQA-MHUG, VQA-MHUG是由斯图加特大学交互与可视化系统研究所创建的一个包含49名参与者在视觉问答任务中对图像和问题进行注视的数据集。该数据集通过高速度眼动追踪技术收集,包含11,970个注视样本,覆盖3,990个问题-图像对,这些样本根据推理类型和难度进行了标记和平衡。VQA-MHUG旨在通过分析人类和神经注意策略的相似性,探索提高视觉问答性能的可能性,特别是在文本注意机制及其在视觉和语言任务架构中的集成方面。
关于 斯图加特大学 , 斯图加特大学是德国的一所著名研究型大学,位于巴登-符腾堡州的斯图加特市。该校在工程学、自然科学和信息技术等领域具有卓越的研究和教学声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)