five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【遇见简讯】RedSage:面向网络安全的开源大模型

五号数据雷达开源数据市场2026-02-05 13:3957
1月29日,阿联酋哈利法大学 RISys Lab 开源发布了网络安全领域大语言模型 RedSage。

1月29日,阿联酋哈利法大学 RISys Lab 开源发布了网络安全领域大语言模型 RedSage。该模型支持本地部署,可作为网络安全助手使用。

现有痛点——安全性与专业能力难以兼顾

  1. 1. 数据隐私与合规风险:依赖专有 API,易导致敏感数据外泄,引发隐私安全问题。
  2. 2. 领域专业能力不足:通用开源模型缺乏网络安全场景适配性,难以满足专业化运维需求。

针对上述问题,RedSage 从领域数据构建、训练流程以及专用评测基准设计三个方面展开优化。

RedSage的核心创新

  1. 1. 领域语料构建:通过大规模网页过滤和人工采集,构建了规模达 118亿 tokens 的网络安全语料库,用于持续预训练。
  2. 2. 专家流程模拟训练:设计智能体式增强流水线,模拟安全专家多轮决策,构建了一个 26.6 万样本的增强数据集,用于监督微调训练。
  3. 3. 评测基准发布:提出了 RedSage-Bench,含3万道选择题与240道开放式问答题,全面覆盖知识、技能与工具使用能力评估。其核心数据集RedSage-MCQ已在 Hugging Face 开源发布,累计下载量超过 6 万次
  4. 4. 模型性能领先:发布的参数规模8B的开源模型RedSage,在网络安全基准测试中,最高超基线+5.59分,Open LLM Leaderboard任务最高提升+5.05分。

数据集地址: RedSage-MCQ

论文地址: RedSage: A Cybersecurity Generalist LLM

简讯图片

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们