UCSC-VLAA本次发布的数据集CIK-Bench,CIK-Bench是一个用于评估OpenClaw个人AI代理安全性的基准数据集,专注于持久状态中毒攻击。OpenClaw是2026年初部署最广泛的个人AI代理。数据集基于CIK分类法,将OpenClaw的持久状态组织为三个维度:能力(Capability)、身份(Identity)和知识(Knowledge)。数据集包含88个攻击案例,覆盖12种影响场景,分为两大伤害类别(隐私泄露和风险不可逆操作),每个类别下有三个子类别。此外,数据集还包含一组匹配的良性案例用于防御评估。数据集以两种形式提供:结构化的parquet文件和原始模板树。结构化数据包含详细的字段描述,如案例ID、维度、伤害类别、向量类型等。数据集适用于文本分类、文本生成等任务,特别关注AI安全、红队测试、代理安全和提示注入等场景。使用该数据集时需遵守伦理准则,仅用于防御性安全研究。





_1769672084863.jpg)