IMDEA Networks Institute 本次发布的数据集 Mimir crawled dataset, 该数据集由Mimir爬虫收集,包含超过25k个站点的页面。数据集的创建是为了研究Tor网络的拓扑结构,以及不同类型内容的分布情况。通过独特的爬取策略,该数据集避免了重复内容的收录,首次为Tor网络中的隐藏服务提供了一个无镜像的网络分析视角。数据集主要用于网络安全和犯罪活动的研究,特别是针对Tor网络中的暗网内容分析。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)