Deep Instinct 本次发布的数据集 DeepURLBench, DeepURLBench是由Deep Instinct和本古里安大学联合创建的一个多类恶意URL分类数据集,旨在提升网络安全领域的URL分类模型性能。该数据集包含超过2200万条URL,分为良性、钓鱼和恶意三类,数据来源于2020年至2023年间的公开拒绝列表和允许列表,并通过VirusTotal进行标签标注。数据集经过严格的清洗和结构化处理,确保了数据的多样性和时效性。该数据集的应用领域主要集中在网络安全,旨在通过深度学习和传统机器学习方法提升恶意URL的实时分类能力,解决现有模型在实时性和准确性上的不足。
README 内容:
关于 Deep Instinct , Deep Instinct是一家专注于利用深度学习技术进行网络安全防护的公司,提供基于人工智能的威胁检测和预防解决方案。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)