曼海姆大学 本次发布的数据集 Survey Item Linking (SIL) Dataset, Survey Item Linking (SIL) Dataset是由曼海姆大学创建的高质量双语数据集,包含20,454条来自100篇完全标注的英德社会科学出版物的句子,涵盖了多样化的主题。数据集的创建过程通过区分变量级和问题级提及,减少了标注过程中的歧义,并显著提高了标注者间的一致性。该数据集主要用于社会科学研究中的调查项目链接任务,旨在解决在社会科学出版物中自动识别和链接调查项目的问题,从而提高研究的FAIR(可查找、可访问、可互操作、可重用)原则的实现。
查看Survey Item Linking (SIL) Dataset
README 内容:
关于 曼海姆大学 , 曼海姆大学是德国的一所公立研究型大学,位于巴登-符腾堡州的曼海姆市。该大学以其经济学、社会科学和信息学等领域的研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)