腾讯微信视觉实验室 本次发布的数据集 WeThink, WeThink数据集是一个包含超过12万个多模态问答对的数据集,每个问答对都带有明确的推理路径。数据集由18个不同的公开图像数据集精心挑选而来,涵盖了各种问题和领域,包括推理、OCR、识别、数学、知识和空间感知等,从而增强了模型的多模态推理能力。WeThink数据集旨在解决多模态推理中缺乏多样化和推理中心数据的问题,并为模型提供了一组全面且具有挑战性的数据,以帮助模型在视觉语言推理任务中取得更好的表现。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)