中国科学院大学 本次发布的数据集 VGR-SFT, VGR-SFT数据集是一个大规模的视觉推理数据集,它包含了混合视觉接地和语言推理的推理数据。该数据集旨在帮助模型学习如何识别问题相关区域,并根据这些区域提供精确答案。VGR-SFT数据集的创建采用了三阶段数据构建流程:冷启动、拒绝采样和注释模型训练。数据集的内容是从现有的大型指令模型生成的,然后通过拒绝采样进行筛选和改进。该数据集的创建是为了帮助模型在推理过程中自由地关注任意的视觉区域,从而提高多模态推理的准确性和可解释性。
Dataset card 内容:
Files and versions 内容:
关于 中国科学院大学 , 中国科学院大学,简称“国科大”,成立于1978年,是中国科学院直属的一所以研究生教育为主的高等学校,肩负着培养高水平科技人才、推动科学技术发展的重要使命。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)