宾夕法尼亚州立大学 本次发布的数据集 CODA-19, CODA-19是由宾夕法尼亚州立大学创建的一个包含10,966篇英文摘要的人工标注数据集,用于标注COVID-19开放研究数据集中的背景、目的、方法、发现/贡献和其他部分。该数据集由248名亚马逊Mechanical Turk的众包工作者在10天内完成,其标注质量与专家相当。每个摘要由九名不同的工作者标注,最终标签通过多数投票确定。CODA-19的标签在与生物医学专家标签比较时准确率达到82.2%,表明非专家众包可以大规模快速参与COVID-19的研究。该数据集有助于科学家访问和整合快速增长的冠状病毒文献,并作为AI/NLP研究的基石,解决获取专家标注速度慢的问题。
关于 宾夕法尼亚州立大学 , 宾夕法尼亚州立大学是一所位于美国宾夕法尼亚州的著名公立研究型大学,以其在工程、商科和生命科学等领域的卓越研究和教学质量而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)