曼海姆大学 本次发布的数据集 OPIEC, OPIEC是一个从英文维基百科全文中提取的大型开放信息抽取语料库,由德国曼海姆大学创建。该数据集包含超过3.4亿个三元组,是迄今为止公开可用的最大的OIE语料库。OPIEC不仅数据量大,还包含丰富的元数据信息,如来源信息、置信度评分、语言标注和语义标注,包括空间和时间信息。这些数据对于下游任务如知识库构建、开放式问答或事件模式归纳非常有价值。OPIEC的创建过程涉及使用Stanford CoreNLP管道和先进的OIE系统MinIE进行文本处理。数据集的应用领域广泛,主要用于自动化知识库构建的研究,旨在解决从自然语言文本中无监督地提取关系及其论据的问题。
关于 曼海姆大学 , 曼海姆大学(University of Mannheim)是德国的一所公立研究型大学,位于巴登-符腾堡州的曼海姆市。该校以其卓越的经济学、社会科学和管理学教育而闻名,尤其在商业管理领域享有国际声誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)