【遇见简讯】RedSage：面向网络安全的开源大模型

1月29日，阿联酋哈利法大学 RISys Lab 开源发布了网络安全领域大语言模型 RedSage。该模型支持本地部署，可作为网络安全助手使用。

现有痛点——安全性与专业能力难以兼顾

针对上述问题，RedSage 从领域数据构建、训练流程以及专用评测基准设计三个方面展开优化。

RedSage的核心创新

1. 领域语料构建：通过大规模网页过滤和人工采集，构建了规模达 118亿 tokens 的网络安全语料库，用于持续预训练。
2. 专家流程模拟训练：设计智能体式增强流水线，模拟安全专家多轮决策，构建了一个 26.6 万样本的增强数据集，用于监督微调训练。
3. 评测基准发布：提出了 RedSage-Bench，含3万道选择题与240道开放式问答题，全面覆盖知识、技能与工具使用能力评估。其核心数据集RedSage-MCQ已在 Hugging Face 开源发布，累计下载量超过 6 万次。
4. 模型性能领先：发布的参数规模8B的开源模型RedSage，在网络安全基准测试中，最高超基线+5.59分，Open LLM Leaderboard任务最高提升+5.05分。

数据集地址： RedSage-MCQ

论文地址： RedSage: A Cybersecurity Generalist LLM

简讯图片