北京航空航天大学 本次发布的数据集 SNS-Bench-VL, SNS-Bench-VL是一个全面的多模态基准,旨在评估视觉语言大型语言模型(LLM)在社交网络服务(SNS)场景中的表现。该数据集包含4001个精心策划的多模态问答对,涵盖单选、多选和开放式任务,跨越8个多模态任务,包括笔记理解、用户参与分析、信息检索和个性化推荐。数据集来自一个拥有超过30亿用户的社交平台,确保了真实反映现实世界社交媒体互动。数据收集过程包括数据收集和处理、不同SNS相关任务的仔细注释以及跨模态质量控制和人机验证。SNS-Bench-VL旨在推动下一代社交网络服务中的鲁棒、情境感知和人性化的多模态智能研究。
关于 北京航空航天大学 , 北京航空航天大学(Beihang University)成立于1952年,是中国一所综合性、研究型大学,以工为主,工、理、管、文、法、经、教育、艺术等多学科协调发展。它是直属于中华人民共和国教育部的高校,也是国防科技工业的重点大学之一,在航空、航天和材料科学等领域具有较高的学术声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)