首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】SafeEdit - 大模型解毒知识编辑基准

五号雷达开源数据市场2024-03-25 15:3447

该数据集为研究LLM的排毒问题提供了新的数据和评估框架，有助于推动该领域的发展，并可以应用于多种方法，如监督式微调、强化学习和知识编辑方法。

浙江大学与蚂蚁集团等机构合作构建的SafeEdit数据集，旨在探讨知识编辑技术对大型语言模型解毒的可行性。该数据集包括4,050个训练样本、2,700个验证样本和1,350个测试样本，覆盖九种不安全类别，如法律、政治敏感、伦理道德等，并提供强大的攻击提示以诱导模型产生有害内容。SafeEdit的设计考虑了模型对恶意输入的防御成功率、对新型恶意输入的泛化防御能力，以及模型对正常用户请求的响应能力。该数据集为研究LLM的排毒问题提供了新的数据和评估框架，有助于推动该领域的发展，并可以应用于多种方法，如监督式微调、强化学习和知识编辑方法。

详情请参见五号雷达：https://www.5radar.com/result?key=SafeEdit

社区讨论

近期热门