首页 / 数据知识产权登记 / 正文

越狱文本训练数据已成功在浙江省数据知识产权登记平台进行登记，应用在文本分类、模型安全性领域

五号数据雷达数据知识产权登记2025-03-12 02:0417

2025-03-11 , 杭州君同未来科技有限责任公司旗下越狱文本训练数据数据知识产权在浙江省数据知识产权登记平台完成登记 , 应用于文本分类、模型安全性领域

杭州君同未来科技有限责任公司本次登记的数据知识产权越狱文本训练数据, 通过语义驱动的上下文多回合生成，越狱文本训练数据被处理为具有攻击性和对抗性特征的训练集。这些数据可用于攻击语言模型的鲁棒性和安全性，从而测试和提升模型的防御能力。在使用中，该数据集能够帮助模型学习和理解具有潜在攻击性、毒性或绕过限制的语言特征，包括上下文关联性、多回合对话模式、攻击策略与抗干扰性等元素。最终训练的模型可以用于多种场景，例如评估模型对敏感请求的响应能力、应对恶意生成的对抗性对话内容，以及在恶意上下文环境中保持稳定性和安全性。1.数据结构：原始文本数据来源于开放对话语料库的攻击性文本，新的有毒文本数据是经过ChatGPT4o大模型处理生成。数据结构的关键字段分别为：目标，类型，生成方式，毒性评分，准确率。目标指的是最终经过ChatGPT4o大模型处理生成的毒性文本。类型指的是毒性文本生成的过程中，根据毒性评分进行阈值分级从而提供的额外标签。生成方式指的是毒性文本生成采用的模型架构名称。毒性评分指的是模型在生成文本时，根据输入内容的上下文和内容特点，为每一段文本分配一个毒性评分。这个评分通常在0到1之间，0表示没有毒性，1表示最高的毒性。准确率指的是一个模型预测结果正确性的常见指标。在毒性文本生成任务中，准确率通常用于评估模型在分类任务中的表现，特别是检测文本是否含有毒性内容。 2.文本预处理：对文本数据进行去重、清洗和标注，包括分词、句法分析、语义解析，确保训练数据具有高质量。 3.毒性标注与分级：使用自动化和人工结合的方式对文本进行毒性评分，并根据毒性评分进行毒性标注与分级，得到训练时的额外标签（类型），包括self-harm，self-harm/intent，sexual，violence。 4.多回合语义生成：基于上下文生成技术，构造多回合对话链，模拟不同的语境和语义攻击场景，以提高模型对复杂语言攻击的理解和识别能力。 5.特征提取：提取文本的语义特征，包括词嵌入、句子嵌入、上下文依赖关系、多回合转折点，以及具有攻击性和绕过模型限制的语义特征。 6.深度学习架构选择：使用双向LSTM、Transformer、GPT架构等模型，对文本特征进行建模。特定场景下采用预训练大语言模型（如GPT-4）微调。 7.模型训练与评估：在标注数据集上训练深度学习模型，采用对比学习和多任务学习的方法，让模型学习识别攻击性文本特征和生成的上下文相关攻击。通过准确率、毒性评分检测等指标评估模型性能。 8.超参数调优：优化训练中的关键参数，如学习率、梯度截断值、正则化参数、批量大小等，以提升模型在复杂任务上的表现。 9.模型验证与优化：使用独立的测试集和对抗样本测试集，验证模型的稳定性和鲁棒性，并根据性能结果对模型进行微调，确保在实际应用场景中的有效性。

查看越狱文本训练数据

登记内容：

关于杭州君同未来科技有限责任公司 , 杭州君同未来科技有限责任公司，是一家专注于大数据处理与分析的高新技术企业，致力于为客户提供智能化数据解决方案。公司凭借先进的技术和优质的服务在行业内建立了良好的声誉。

关于浙江省数据知识产权登记平台 , 浙江省数据知识产权登记平台是浙江省市场监督管理局（省知识产权局）联合多个部门开发建设的数字化应用，属于‘浙江知识产权在线’的应用场景之一。该平台旨在提供数据知识产权登记公共服务，通过区块链存证或数据保全公证，对数据知识产权进行登记，颁发登记证书，用于数据流通交易、收益分配和权益保护。

社区讨论

近期热门