five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

首尔国立大学 发布 RoParQ 数据集, 应用在 自然语言处理、鲁棒性评估 领域

五号数据雷达开源数据市场2025-11-28 14:4115
RoParQ 是 首尔国立大学 发布的数据集,于 2025-11-27 首发在 arXiv 应用于 自然语言处理、鲁棒性评估 领域

首尔国立大学 本次发布的数据集 RoParQ, RoParQ是由首尔国立大学构建的专用于评估大语言模型对转述问题鲁棒性的基准数据集。该数据集包含10,273条高质量多选问答样本,源自MMLU、ARC、CommonsenseQA和MathQA四大权威数据集,通过Gemini和Claude等专有模型生成语义等价的转述变体。数据集构建过程采用严格的预处理流程,包括封闭式问答筛选、问题长度控制及基于法官模型的不一致置信度过滤机制。该数据集主要应用于增强大语言模型的语义不变性理解,旨在解决模型对表面语言模式过度依赖而导致的转述敏感性问题,推动可信人工智能的发展。

查看RoParQ

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 首尔国立大学 , 首尔国立大学是韩国最顶级的公立研究型综合大学,以其卓越的教学和科研实力享誉全球。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们