five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】SafeEdit - 大模型解毒知识编辑基准

五号雷达开源数据市场2024-03-25 15:3447
该数据集为研究LLM的排毒问题提供了新的数据和评估框架,有助于推动该领域的发展,并可以应用于多种方法,如监督式微调、强化学习和知识编辑方法。

浙江大学与蚂蚁集团等机构合作构建的SafeEdit数据集,旨在探讨知识编辑技术对大型语言模型解毒的可行性。该数据集包括4,050个训练样本、2,700个验证样本和1,350个测试样本,覆盖九种不安全类别,如法律、政治敏感、伦理道德等,并提供强大的攻击提示以诱导模型产生有害内容。SafeEdit的设计考虑了模型对恶意输入的防御成功率、对新型恶意输入的泛化防御能力,以及模型对正常用户请求的响应能力。该数据集为研究LLM的排毒问题提供了新的数据和评估框架,有助于推动该领域的发展,并可以应用于多种方法,如监督式微调、强化学习和知识编辑方法。

详情请参见五号雷达:https://www.5radar.com/result?key=SafeEdit
数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们