杭州君同未来科技有限责任公司 本次登记的数据知识产权 越狱文本训练数据, 通过语义驱动的上下文多回合生成,越狱文本训练数据被处理为具有攻击性和对抗性特征的训练集。这些数据可用于攻击语言模型的鲁棒性和安全性,从而测试和提升模型的防御能力。在使用中,该数据集能够帮助模型学习和理解具有潜在攻击性、毒性或绕过限制的语言特征,包括上下文关联性、多回合对话模式、攻击策略与抗干扰性等元素。最终训练的模型可以用于多种场景,例如评估模型对敏感请求的响应能力、应对恶意生成的对抗性对话内容,以及在恶意上下文环境中保持稳定性和安全性。1.数据结构: 原始文本数据来源于开放对话语料库的攻击性文本,新的有毒文本数据是经过ChatGPT4o大模型处理生成。数据结构的关键字段分别为:目标,类型,生成方式,毒性评分,准确率。目标指的是最终经过ChatGPT4o大模型处理生成的毒性文本。类型指的是毒性文本生成的过程中,根据毒性评分进行阈值分级从而提供的额外标签。生成方式指的是毒性文本生成采用的模型架构名称。毒性评分指的是模型在生成文本时,根据输入内容的上下文和内容特点,为每一段文本分配一个毒性评分。这个评分通常在0到1之间,0表示没有毒性,1表示最高的毒性。准确率指的是一个模型预测结果正确性的常见指标。在毒性文本生成任务中,准确率通常用于评估模型在分类任务中的表现,特别是检测文本是否含有毒性内容。 2.文本预处理: 对文本数据进行去重、清洗和标注,包括分词、句法分析、语义解析,确保训练数据具有高质量。 3.毒性标注与分级: 使用自动化和人工结合的方式对文本进行毒性评分,并根据毒性评分进行毒性标注与分级,得到训练时的额外标签(类型),包括self-harm,self-harm/intent,sexual,violence。 4.多回合语义生成: 基于上下文生成技术,构造多回合对话链,模拟不同的语境和语义攻击场景,以提高模型对复杂语言攻击的理解和识别能力。 5.特征提取: 提取文本的语义特征,包括词嵌入、句子嵌入、上下文依赖关系、多回合转折点,以及具有攻击性和绕过模型限制的语义特征。 6.深度学习架构选择: 使用双向LSTM、Transformer、GPT架构等模型,对文本特征进行建模。特定场景下采用预训练大语言模型(如GPT-4)微调。 7.模型训练与评估: 在标注数据集上训练深度学习模型,采用对比学习和多任务学习的方法,让模型学习识别攻击性文本特征和生成的上下文相关攻击。通过准确率、毒性评分检测等指标评估模型性能。 8.超参数调优: 优化训练中的关键参数,如学习率、梯度截断值、正则化参数、批量大小等,以提升模型在复杂任务上的表现。 9.模型验证与优化: 使用独立的测试集和对抗样本测试集,验证模型的稳定性和鲁棒性,并根据性能结果对模型进行微调,确保在实际应用场景中的有效性。
登记内容:
关于 杭州君同未来科技有限责任公司 , 杭州君同未来科技有限责任公司,是一家专注于大数据处理与分析的高新技术企业,致力于为客户提供智能化数据解决方案。公司凭借先进的技术和优质的服务在行业内建立了良好的声誉。
关于 浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是浙江省市场监督管理局(省知识产权局)联合多个部门开发建设的数字化应用,属于‘浙江知识产权在线’的应用场景之一。该平台旨在提供数据知识产权登记公共服务,通过区块链存证或数据保全公证,对数据知识产权进行登记,颁发登记证书,用于数据流通交易、收益分配和权益保护。





_1769672084863.jpg)