five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】MULTI - 多模态基准测试数据集

五号雷达开源数据市场2024-03-10 16:5964
上海交通大学发布的多模态基准测试MULTI,旨在评测多模态大模型在理解复杂的表格和图像、以及进行长文本推理的能力。该测试提供多模态输入,并要求回答是精确的或开放式的,反映了现实生活中的考试风格。

上海交通大学发布的多模态基准测试MULTI,旨在评测多模态大模型在理解复杂的表格和图像、以及进行长文本推理的能力。该测试提供多模态输入,并要求回答是精确的或开放式的,反映了现实生活中的考试风格。MULTI包含逾 18,000 个问题,涵盖从公式推导到图像分析及跨模态推理的多样化任务。研究团队还创建了MULTI-Elite,一个精心挑选的包含500个问题的难题子集,以及MULTI-Extend,包含超过 4,500 个外部知识上下文的数据集。MULTI不仅作为一个稳健的评测平台,也为专家级AI的发展指明了方向。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们