Walled AI 本次发布的数据集 CSRT, CSRT数据集是一个用于评估和分析大型语言模型(LLM)通过代码切换红队技术的数据集,旨在同时测试模型的多语言理解和安全性。该数据集包含315个代码切换查询,结合多达10种语言,并引发广泛的不可取行为。通过与现有方法相比,CSRT在英语中实现了46.7%的更多攻击。数据集包括提示、原始文本和危害序列等特征,分为训练集,包含315个样本。
Dataset card 内容:
Files and versions 内容:
关于 Walled AI , Walled AI是一家专注于开发基于人工智能技术的网络安全解决方案,致力于通过智能分析和防御机制,保护企业和个人免受网络威胁的组织。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)