1月29日,阿联酋哈利法大学 RISys Lab 开源发布了网络安全领域大语言模型 RedSage。该模型支持本地部署,可作为网络安全助手使用。
现有痛点——安全性与专业能力难以兼顾
- 1. 数据隐私与合规风险:依赖专有 API,易导致敏感数据外泄,引发隐私安全问题。
- 2. 领域专业能力不足:通用开源模型缺乏网络安全场景适配性,难以满足专业化运维需求。
针对上述问题,RedSage 从领域数据构建、训练流程以及专用评测基准设计三个方面展开优化。
RedSage的核心创新
- 1. 领域语料构建:通过大规模网页过滤和人工采集,构建了规模达 118亿 tokens 的网络安全语料库,用于持续预训练。
- 2. 专家流程模拟训练:设计智能体式增强流水线,模拟安全专家多轮决策,构建了一个 26.6 万样本的增强数据集,用于监督微调训练。
- 3. 评测基准发布:提出了 RedSage-Bench,含3万道选择题与240道开放式问答题,全面覆盖知识、技能与工具使用能力评估。其核心数据集RedSage-MCQ已在 Hugging Face 开源发布,累计下载量超过 6 万次。
- 4. 模型性能领先:发布的参数规模8B的开源模型RedSage,在网络安全基准测试中,最高超基线+5.59分,Open LLM Leaderboard任务最高提升+5.05分。
数据集地址: RedSage-MCQ
论文地址: RedSage: A Cybersecurity Generalist LLM






_1769672084863.jpg)