国防科技大学 本次发布的数据集 arXiv4TGC, arXiv4TGC是一个专为大规模时序图聚类设计的新颖学术数据集,包含arXivAI、arXivCS、arXivMath、arXivPhy和arXivLarge五个子数据集。这些数据集从arXiv开放平台提取,涵盖172个子领域,以论文为节点,引用关系为边,记录了时间依赖的交互。其中最大的数据集arXivLarge包含130万个标记节点和1000万条时序边。数据集创建过程中,首先从原始数据提取节点交互信息,根据领域分类提取边,重编号节点并更新标签列表,最后提供基于位置编码的节点特征。arXiv4TGC不仅适用于时序图聚类,还可用于其他图学习任务,如节点分类,旨在解决现有时序图数据集规模小、标签不可靠的问题。
README 内容:
关于 国防科技大学 , 国防科技大学是中国的一所重点军事院校,主要从事国防科技研究和军事人才培养。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)