five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

新加坡管理大学 发布 SecureAgentBench 数据集, 应用在 代码安全、代理评估 领域

五号数据雷达开源数据市场2025-10-08 04:4662
SecureAgentBench 是 新加坡管理大学 发布的数据集,于 2025-09-26 首发在 arXiv 应用于 代码安全、代理评估 领域

新加坡管理大学 本次发布的数据集 SecureAgentBench, SecureAgentBench是一个包含105个编码任务的数据集,旨在严格评估代码代理在安全代码生成方面的能力。每个任务都包括真实的任务设置,需要在大型的代码库中进行多文件编辑,基于真实世界的开源漏洞构建的上下文,以及功能测试、通过概念验证漏洞进行的漏洞检查和静态分析检测新引入漏洞的全面评估。该数据集旨在模拟软件开发过程中人类开发者引入漏洞的情境,并提供了真实且符合实际软件演变的评估场景。

查看SecureAgentBench

README 内容: 

 

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们