苏州大学 本次发布的数据集 MMLongCite, MMLongCite是一个用于评估大型视觉语言模型(LVLMs)在长上下文场景中忠实度的综合基准。该数据集包含8个不同的任务,跨越6个上下文长度区间,并融合了多种模态,包括文本、图像和视频。MMLongCite旨在克服现有基准的局限性,通过包含更大规模和更多样化的数据来解决这些问题。数据集的上下文长度从8K到48K Tokens不等,涵盖了从单源视觉推理到多源视觉推理、视觉定位和视频理解等多种任务,为评估LVLMs在长上下文场景中的性能提供了一个全面且严格的基准。
README 内容:
关于 苏州大学 , 苏州大学是中国的一所综合性大学,位于江苏省苏州市,拥有多个学院和研究机构,涵盖广泛的学科领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)