Naver AI 本次发布的数据集 MMRefine, 该数据集是一个旨在评估多模态大型语言模型(MLLMs)在六种不同错误场景下的错误修正能力的基准测试。它将错误分为六类,并提供了关于MLLMs修正性能的深入见解。该基准测试涵盖了多种MLLMs,包括闭源和开源模型,其任务重点是MLLMs中的错误检测与纠正。
README 内容:
关于 Naver AI , Naver AI 是韩国 Naver 公司旗下的一个人工智能研发部门,专注于深度学习和自然语言处理等领域的研发。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)