five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】GITQA - 多模态图推理问答数据集

五号雷达开源数据市场2024-03-05 16:3739
该数据集可用于评估基于文字描述的LLM和基于多模态的MLLM在图推理任务上的性能,并研究视觉信息对图推理的影响。

GITQA是香港科技大学和南方科技大学,通过将图结构绘制为不同风格的视觉图像,构建的首个包含视觉图的推理问答数据集,该数据集包含超过423K个问答实例,每个实例包含相互对应的图结构-文本-视觉信息及其相应的问答对。数据集包含两个版本:GITQA-Base和GITQA-Aug,其中GITQA-Base只包含单一风格的视觉图。GITQA-Aug则更加丰富,它对视觉图进行了多种数据增强处理,包括改变布局、点的形状、边的宽度和点的风格等,从而提供了更多样化的视觉图表现。该数据集可用于评估基于文字描述的LLM和基于多模态的MLLM在图推理任务上的性能,并研究视觉信息对图推理的影响。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们