首页 / 开源数据市场 / 正文

捷克技术大学发布7.8万级对抗性恶意软件数据集填补AI安全检测鲁棒性评估基准空白

五号数据雷达开源数据市场2026-05-27 05:205

捷克技术大学网络安全研究团队于2026年5月25日在学术预印本平台arXiv首发Adversarial Malware Dataset对抗性恶意软件数据集，基于真实恶意样本库生成的7.79万个标注对抗样本，可为恶意软件对抗样本研究、AI检测系统鲁棒性评估提供标准化测试支撑。

近年来，随着恶意软件变种迭代速度持续加快，传统基于特征码匹配的检测方案已难以应对爆发式增长的网络威胁，基于机器学习的智能检测系统成为全球网络安全厂商的主流技术选型。但与此同时，恶意攻击者可通过对恶意软件进行不改变核心功能的微小修改，生成对抗性样本绕过AI检测模型的识别，这类逃逸攻击已成为当前网络安全防御体系面临的核心痛点之一，而标注完善、覆盖全面的标准化对抗性恶意软件数据集，是开展相关技术研究、验证检测系统可靠性的核心基础资源。

本次捷克技术大学发布的Adversarial Malware Dataset，正是瞄准行业公共基础资源缺口推出的专业数据集。该对抗性恶意软件数据集由捷克技术大学网络安全研究团队构建，基于真实世界恶意软件样本库RawMal-TF生成，研究团队采用Gym-malware、MAB-Malware等主流对抗生成技术，对原始恶意软件进行功能保持性修改，在不破坏原有恶意攻击能力的前提下生成可逃逸常见检测模型的对抗样本，最终形成按家族和类型标记的两个子集，共计77,943个对抗性PE文件。所有样本均附带详细的元数据，包括EMBER分类器评分和VirusTotal平台多引擎检测结果，可支撑不同维度的研究与测试需求。

作为专门面向网络安全AI技术研发场景设计的数据集，Adversarial Malware Dataset的核心价值在于为机器学习恶意软件检测系统的鲁棒性评估提供统一基准，可支持对抗训练、数据投毒攻击研究等多个安全应用场景。对于网络安全厂商而言，可借助该数据集测试自有AI检测模型对逃逸样本的识别能力，定位模型漏洞并通过对抗训练优化检测准确率；对于科研机构而言，可基于该数据集开展对抗性样本生成逻辑、鲁棒性检测算法的相关研究；此外，该数据集还可作为网络安全攻防演练的样本资源，支撑红蓝对抗中针对AI检测系统的测试场景，最终助力提升整个网络安全防御体系对抗新型逃避攻击的能力。

查看Adversarial Malware Dataset

详情页内容：

社区讨论

近期热门

捷克技术大学发布7.8万级对抗性恶意软件数据集 填补AI安全检测鲁棒性评估基准空白

详情页内容：

社区讨论

捷克技术大学发布7.8万级对抗性恶意软件数据集填补AI安全检测鲁棒性评估基准空白