艾伦人工智能研究所 本次发布的数据集 CORD-19, CORD-19是由艾伦人工智能研究所与多个合作伙伴共同创建的一个关于COVID-19及相关历史冠状病毒研究的大型数据集。该数据集包含超过140,000篇科学论文和预印本,主要来源于PubMed Central、PubMed、世界卫生组织的Covid-19数据库以及预印本服务器bioRxiv、medRxiv和arXiv。CORD-19旨在通过提供丰富的元数据和结构化全文论文,促进文本挖掘和信息检索系统的发展。数据集的创建过程中,面临了从多个来源整合和标准化数据的挑战,同时确保了数据的及时更新。CORD-19的应用领域广泛,包括支持临床研究和系统评价,以及为数据科学家和机器学习实践者构建搜索和提取工具,旨在加速发现COVID-19的有效治疗方法和管理政策。
关于 艾伦人工智能研究所 , 艾伦人工智能研究所是一家专注于AI研究和应用的高级研究机构。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)