马里兰大学巴尔的摩分校 本次发布的数据集 METAMORPHASM DATASET (MAD), METAMORPHASM DATASET (MAD) 是由马里兰大学巴尔的摩分校的研究团队创建的一个专门用于测试大型语言模型(LLMs)在生成和分析混淆汇编代码能力的基准数据集。该数据集包含328,200个混淆汇编代码样本,涵盖三种混淆技术:死代码插入、寄存器替换和控制流变化。数据集的创建过程包括从Windows动态链接库和可执行文件中提取和反汇编源代码,经过预处理、混淆处理和人工验证,最终形成一个统一的Excel格式数据集。该数据集主要用于研究LLMs在代码混淆领域的应用,旨在提高反病毒引擎的检测能力,并帮助研究人员开发针对代码混淆的解决方案。
关于 马里兰大学巴尔的摩分校 , 马里兰大学巴尔的摩分校(University of Maryland, Baltimore,简称UMB)是美国马里兰州巴尔的摩市的一所公立研究型大学,专注于健康科学、法律、社会工作和药学等领域的教育和研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)