德国汉诺威莱布尼茨科学与技术信息中心 本次发布的数据集 PatFigVQA, PatFigCLS, PatFigVQA和PatFigCLS是由德国汉诺威莱布尼茨科学与技术信息中心创建的两个数据集,旨在通过视觉问答(VQA)和分类任务来提升专利图的分类效果。PatFigCLS数据集包含35,926个专利图,分为10种类型,数据来源于扩展的CLEF-IP 2011数据集和DeepPatent2数据集。数据集的创建过程包括对专利图的类型、投影、对象和USPC类别的分类,并通过规则匹配和聚类方法对数据进行标准化处理。该数据集主要用于专利检索系统中的多面搜索,帮助专利审查员更高效地找到相关专利。
README 内容:
关于 德国汉诺威莱布尼茨科学与技术信息中心 , 德国汉诺威莱布尼茨科学与技术信息中心(TIB)是德国最大的科学与技术专业图书馆,同时也是世界上最大的科学与技术信息中心之一。TIB提供广泛的科学和技术领域的文献和信息服务,支持科研、教育和工业领域的信息需求。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)