阿布扎比技术革新研究所 本次发布的数据集 DFIR-Metric, DFIR-Metric数据集是专为评估大型语言模型(LLM)在数字取证和事件响应(DFIR)领域的表现而设计的基准数据集。数据集包含三个部分:知识评估、现实取证挑战和实用分析。知识评估部分由700个专家评审的多项选择题组成,这些题目来源于行业标准认证和官方文档。现实取证挑战部分包含150个CTF风格的测试,用于检验多步推理和证据关联能力。实用分析部分则包含500个来自NIST计算机取证工具测试计划(CFTT)的磁盘和内存取证案例。DFIR-Metric数据集旨在提供一个严格、可重复的框架,以推动人工智能在数字取证领域的进步。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)