哈塞特佩大学 本次发布的数据集 RecipeQA, RecipeQA是一个针对烹饪食谱多模态理解的数据集,由哈塞特佩大学计算机视觉实验室创建。该数据集包含约20,000个食谱,每个食谱配有标题、描述和一组对齐的图像,总计超过36,000个自动生成的问题-答案对。数据集通过多种理解任务,如文本填空、视觉填空、视觉连贯性和视觉排序,评估机器对图像和文本的联合理解能力,以及对事件时序流程和程序知识的理解。RecipeQA旨在为机器理解系统提供一个挑战性的测试平台,并作为评估基准。
关于 哈塞特佩大学 , 哈塞特佩大学是土耳其的一所著名大学,提供广泛的学术课程和研究机会,尤其在计算机工程和计算机视觉领域有显著的研究成果。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)