five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

宾夕法尼亚大学 发布 QUEST 数据集, 应用在 自然语言处理、信息检索 领域

五号数据雷达开源数据市场2024-10-13 13:0246
QUEST 是 宾夕法尼亚大学 发布的数据集,于 2023-05-31 首发在 arXiv 应用于 自然语言处理、信息检索 领域

宾夕法尼亚大学 本次发布的数据集 QUEST, QUEST数据集由宾夕法尼亚大学和Google DeepMind共同创建,包含3357条自然语言查询,这些查询隐含了集合操作,如交集、并集和差集。数据集挑战模型匹配查询中的多个约束与文档中的相应证据,并正确执行各种集合操作。数据集通过半自动方式构建,使用维基百科类别名称,自动从单个类别生成查询,然后通过众包工作者进行改写和进一步验证自然性和流畅性。众包工作者还评估实体的相关性,并突出显示查询约束到文档文本的归属。数据集的应用领域包括分析检索系统在处理此类查询时的性能,旨在解决检索系统在处理复杂查询时的挑战。

查看QUEST

关于 宾夕法尼亚大学 , 宾夕法尼亚大学是美国一所著名的私立研究型大学,以其高质量的教育和广泛的学科领域而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们