康斯坦茨大学 本次发布的数据集 S2ORC, S2ORC数据集是从Semantic Scholar文献语料库中筛选出来的综合数据集,涵盖了医学、物理、生物、计算机科学等多个领域的论文。该数据集提供了论文的全文、注释、作者信息、引用作品和注释内容元素。数据集的创建过程包括从S2ORC中提取数据,并根据不同的特征(如引用位置、上下文类型等)生成诊断数据集。该数据集主要用于评估和分析引用推荐模型的性能,旨在解决引用推荐系统中的多样性和标准化问题。
关于 康斯坦茨大学 , 康斯坦茨大学(University of Konstanz)位于德国,是一所综合性大学,以其高质量的教学和研究著称,特别是在社会科学和人文学科领域有显著的成就。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)