中山大学 本次发布的数据集 MINDGYM, MINDGYM数据集是由中山大学和阿里巴巴集团共同创建的,旨在通过合成自我挑战性问题来增强视觉语言模型的能力。该数据集涵盖了文本和多媒体环境下的认知问题,分为三个阶段:单跳问题合成、挑战性多跳问题合成和思维驱动的课程微调。具体内容包含了八个语义领域的单跳问题,以及通过多样化认知操作符组合形成多跳问题。该数据集的应用领域是视觉语言推理,旨在提升模型在多模态、高阶认知任务中的性能。
关于 中山大学 , 中山大学是中国的一所综合性大学,位于广东省广州市,是中国南方的重要学术中心之一,拥有多个学科领域的优势。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)