滑铁卢大学 本次发布的数据集 VisualWebInstruct, VisualWebInstruct是一个由滑铁卢大学等机构提出的新型数据集,通过利用搜索引擎创建包含多个学科如数学、物理、金融、化学等的高质量、多样化的数据集。该数据集从30,000个精选的种子图像出发,使用Google Image搜索来识别包含相似图像的网站,收集并处理超过700,000个独立URL源的HTML内容,构建了一个大约有900,000个问答对的数据集,其中40%是视觉问答对,其余为文本问答对。该数据集适用于提升视觉语言模型在需要多步骤推理的复杂任务上的性能。
关于 滑铁卢大学 , 滑铁卢大学是一所世界知名的公立研究型大学,位于加拿大安大略省滑铁卢市,以其数学、工程学和计算机科学等学科而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)