five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

宾夕法尼亚州立大学 发布 CODA-19 数据集, 应用在 COVID-19研究、众包标注 领域

五号数据雷达开源数据市场2024-10-13 09:2160
CODA-19 是 宾夕法尼亚州立大学 发布的数据集,于 2020-09-18 首发在 arXiv 应用于 COVID-19研究、众包标注 领域

宾夕法尼亚州立大学 本次发布的数据集 CODA-19, CODA-19是由宾夕法尼亚州立大学创建的一个包含10,966篇英文摘要的人工标注数据集,用于标注COVID-19开放研究数据集中的背景、目的、方法、发现/贡献和其他部分。该数据集由248名亚马逊Mechanical Turk的众包工作者在10天内完成,其标注质量与专家相当。每个摘要由九名不同的工作者标注,最终标签通过多数投票确定。CODA-19的标签在与生物医学专家标签比较时准确率达到82.2%,表明非专家众包可以大规模快速参与COVID-19的研究。该数据集有助于科学家访问和整合快速增长的冠状病毒文献,并作为AI/NLP研究的基石,解决获取专家标注速度慢的问题。

查看CODA-19

关于 宾夕法尼亚州立大学 , 宾夕法尼亚州立大学是一所位于美国宾夕法尼亚州的著名公立研究型大学,以其在工程、商科和生命科学等领域的卓越研究和教学质量而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们