five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

伊利诺伊大学厄巴纳-香槟分校发布BIRD-Verified数据集,应用在Text-to-SQL、自然语言处理领域

五号数据雷达开源数据市场2026-03-24 04:5665
BIRD-Verified是伊利诺伊大学厄巴纳-香槟分校发布的数据集,于2026-03-20首发在arXiv应用于Text-to-SQL、自然语言处理领域

伊利诺伊大学厄巴纳-香槟分校本次发布的数据集BIRD-Verified,BIRD-Verified是由伊利诺伊大学团队构建的高质量Text-to-SQL数据集,包含2,462条经过多轮专家验证的样本。该数据集基于BIRD基准训练集,通过设计数据校正流程修复了61.1%样本的SQL查询错误、26.2%的自然语言问题错误和18.2%的外部知识错误。数据创建过程采用2-4轮独立人工校验机制,显著提升了RLVR训练效果,使模型推理准确率提升8.2-13.9%。该数据集主要应用于提升大语言模型的SQL推理能力,解决文本到SQL转换任务中数据噪声导致的性能瓶颈问题。

查看BIRD-Verified

README内容:

 

关于伊利诺伊大学厄巴纳-香槟分校,伊利诺伊大学厄巴纳-香槟分校(UIUC)是美国顶尖的公立研究型大学,位于伊利诺伊州的厄巴纳和香槟市。该校在工程、计算机科学、商学等领域享有盛誉,拥有众多诺贝尔奖得主和图灵奖得主。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们