马里兰大学帕克分校 本次发布的数据集 Multi-Crit, Multi-Crit是由马里兰大学与滑铁卢大学联合构建的多模态评估基准,专注于评估模型在多元化标准遵循方面的能力。该数据集包含1425条经过精细标注的样本,涵盖开放生成与可验证推理两大任务类型,数据来源于8个权威多模态数据集并通过多阶段过滤机制确保质量。其构建过程采用严谨的人工标注流程,由9名博士标注者对每个样本进行多维度标准评估,最终形成包含标准冲突的标注体系。该数据集主要应用于多模态大模型的评估系统优化,旨在解决传统单维度评估无法捕捉标准间权衡与冲突的核心问题。
关于 马里兰大学帕克分校 , 马里兰大学帕克分校是美国马里兰州的一所公立研究型大学,也是马里兰大学系统中的旗舰校区,以其在科学、工程、公共卫生等领域的优秀研究和教学质量而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)