five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

国防科技大学 发布 arXiv4TGC 数据集, 应用在 时序图聚类、图学习 领域

五号数据雷达开源数据市场2024-10-13 13:0368
arXiv4TGC 是 国防科技大学 发布的数据集,于 2023-06-08 首发在 arXiv 应用于 时序图聚类、图学习 领域

国防科技大学 本次发布的数据集 arXiv4TGC, arXiv4TGC是一个专为大规模时序图聚类设计的新颖学术数据集,包含arXivAI、arXivCS、arXivMath、arXivPhy和arXivLarge五个子数据集。这些数据集从arXiv开放平台提取,涵盖172个子领域,以论文为节点,引用关系为边,记录了时间依赖的交互。其中最大的数据集arXivLarge包含130万个标记节点和1000万条时序边。数据集创建过程中,首先从原始数据提取节点交互信息,根据领域分类提取边,重编号节点并更新标签列表,最后提供基于位置编码的节点特征。arXiv4TGC不仅适用于时序图聚类,还可用于其他图学习任务,如节点分类,旨在解决现有时序图数据集规模小、标签不可靠的问题。

查看arXiv4TGC

README 内容: 

 

关于 国防科技大学 , 国防科技大学是中国的一所重点军事院校,主要从事国防科技研究和军事人才培养。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们