Indonesia 本次发布的数据集 forensic timeline datasets, 本研究提出了一种标准化的方法来定量评估大型语言模型(LLMs)在数字取证时间线分析任务中的应用。论文描述了该方法论的组成部分,包括数据集、时间线生成和真实值开发。此外,论文建议使用BLEU和ROUGE指标通过案例研究或涉及时间线分析的任务来定量评估LLMs。实验结果表明,使用ChatGPT的实验证明了所提出的方法可以有效评估基于LLM的取证时间线分析。最后,我们讨论了将LLMs应用于取证时间线分析的限制。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)