伊利诺伊大学厄巴纳-香槟分校本次发布的数据集BIRD-Verified,BIRD-Verified是由伊利诺伊大学团队构建的高质量Text-to-SQL数据集,包含2,462条经过多轮专家验证的样本。该数据集基于BIRD基准训练集,通过设计数据校正流程修复了61.1%样本的SQL查询错误、26.2%的自然语言问题错误和18.2%的外部知识错误。数据创建过程采用2-4轮独立人工校验机制,显著提升了RLVR训练效果,使模型推理准确率提升8.2-13.9%。该数据集主要应用于提升大语言模型的SQL推理能力,解决文本到SQL转换任务中数据噪声导致的性能瓶颈问题。
README内容:
关于伊利诺伊大学厄巴纳-香槟分校,伊利诺伊大学厄巴纳-香槟分校(UIUC)是美国顶尖的公立研究型大学,位于伊利诺伊州的厄巴纳和香槟市。该校在工程、计算机科学、商学等领域享有盛誉,拥有众多诺贝尔奖得主和图灵奖得主。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)