Walled AI 本次发布的数据集 MultiJail, 该数据集包含315个英语不安全提示,并被标注为九种非英语语言。这些语言分为高资源、中等资源和低资源三类。数据集的目的是研究大型语言模型在多语言环境下的安全挑战,特别是关于‘越狱’挑战的研究。
Dataset card 内容:
Files and versions 内容:
关于 Walled AI , Walled AI是一家专注于开发基于人工智能技术的网络安全解决方案,致力于通过智能分析和防御机制,保护企业和个人免受网络威胁的组织。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)