成均馆大学本次发布的数据集GraSD,GraSD(Graded Scalar Diversity)是由成均馆大学构建的语义推理数据集,专注于量化标量词的语用强度差异。该数据集整合了来自四项研究的121个<弱项,强项>标量词对,并通过GPT-4o基于理论约束生成上下文实例,最终扩展为12.1万条句子数据。其构建过程采用理论驱动的数据增强策略,确保在多样化语境中保持标量含义的稳定性。该数据集主要用于评估大语言模型对人类分级语用推理的模拟能力,为解决模型在语义隐含推理中缺乏词汇敏感性的问题提供基准。
README内容:
关于成均馆大学,成均馆大学是韩国的一所历史悠久、学术声誉卓越的综合性大学,其教育质量和研究水平在国际上享有较高评价。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)