five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

成均馆大学发布GraSD数据集,应用在语义推理、自然语言处理领域

五号数据雷达开源数据市场2026-04-10 04:3619
GraSD是成均馆大学发布的数据集,于2026-04-08首发在arXiv应用于语义推理、自然语言处理领域

成均馆大学本次发布的数据集GraSD,GraSD(Graded Scalar Diversity)是由成均馆大学构建的语义推理数据集,专注于量化标量词的语用强度差异。该数据集整合了来自四项研究的121个<弱项,强项>标量词对,并通过GPT-4o基于理论约束生成上下文实例,最终扩展为12.1万条句子数据。其构建过程采用理论驱动的数据增强策略,确保在多样化语境中保持标量含义的稳定性。该数据集主要用于评估大语言模型对人类分级语用推理的模拟能力,为解决模型在语义隐含推理中缺乏词汇敏感性的问题提供基准。

查看GraSD

README内容:

 

关于成均馆大学,成均馆大学是韩国的一所历史悠久、学术声誉卓越的综合性大学,其教育质量和研究水平在国际上享有较高评价。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们