首页 / 开源数据市场 / 正文

成均馆大学发布GraSD数据集,应用在语义推理、自然语言处理领域

五号数据雷达开源数据市场2026-04-10 04:3619

GraSD是成均馆大学发布的数据集,于2026-04-08首发在arXiv应用于语义推理、自然语言处理领域

成均馆大学本次发布的数据集GraSD,GraSD（Graded Scalar Diversity）是由成均馆大学构建的语义推理数据集，专注于量化标量词的语用强度差异。该数据集整合了来自四项研究的121个<弱项，强项>标量词对，并通过GPT-4o基于理论约束生成上下文实例，最终扩展为12.1万条句子数据。其构建过程采用理论驱动的数据增强策略，确保在多样化语境中保持标量含义的稳定性。该数据集主要用于评估大语言模型对人类分级语用推理的模拟能力，为解决模型在语义隐含推理中缺乏词汇敏感性的问题提供基准。

查看GraSD

README内容：

关于成均馆大学,成均馆大学是韩国的一所历史悠久、学术声誉卓越的综合性大学，其教育质量和研究水平在国际上享有较高评价。

关于arXiv,全球最大的预印本学术论文数据库，涵盖物理、数学、计算机科学等多个学科领域。

社区讨论

近期热门