five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

中南财经政法大学发布safety–reasoning dataset数据集,应用在大语言模型安全、安全推理领域

五号数据雷达开源数据市场2026-04-14 08:1644
safety–reasoning dataset是中南财经政法大学发布的数据集,于2026-04-10首发在arXiv应用于大语言模型安全、安全推理领域

中南财经政法大学本次发布的数据集safety–reasoning dataset,该安全推理数据集由研究团队为探究大语言模型的安全对齐问题而构建,旨在支持触发式思维链劫持的缓解研究。数据集包含经过安全标注的推理链样本,通过多阶段逆向树搜索(MRTS)方法合成恶意输出对齐的思维链数据,解决了传统恶意推理数据稀缺的瓶颈。其核心应用领域为提升大语言模型在开放权重生态系统中的安全推理能力,特别针对适配器微调场景下的持续性后门攻击防御。

查看safety–reasoning dataset

关于中南财经政法大学,中南财经政法大学是中华人民共和国教育部直属的一所以经济学、法学、管理学为主干,兼有哲学、文学、史学、理学、工学、艺术学等九大学科门类的普通高等学校。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们