佐治亚理工学院 本次发布的数据集 Scito2M, Scito2M是由佐治亚理工学院、加州大学洛杉矶分校和威廉与玛丽学院联合创建的一个大规模科学计量数据集,涵盖了自1991年以来的超过200万篇学术出版物。该数据集提供了详细的元数据,包括标题、摘要、全文、关键词、主题分类和全面的引用图,支持跨学科的科学计量分析。数据集的创建过程包括从arXiv平台获取数据,并使用GPT-4进行关键词提取。Scito2M主要应用于科学知识的时序分析,旨在揭示学术术语的演变、引用模式和跨学科知识交流,从而解决全球性挑战如疫情、气候变化和伦理AI等问题。
关于 佐治亚理工学院 , 佐治亚理工学院(Georgia Institute of Technology),简称Georgia Tech,是一所位于美国佐治亚州亚特兰大市的公立研究型大学。该校以工程、计算机科学、商学和建筑学等领域的教育与研究闻名,是美国顶尖的理工学院之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)