five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

【五号雷达-数据快讯】TANQ - 开放阈多源信息构建的表格问答数据集

五号雷达开源数据市场2024-05-14 15:3767
TANQ数据集适用于开发和评估能够处理多步推理、数学运算和单位转换等复杂任务的大模型。

TANQ(Table Answered Questions)是伦敦国王学院和谷歌联合构建的一个开放域问答数据集,要求从多个来源构建表格形式的答案。该数据集包含1395个问题,涵盖了简单、交集和组合三种类型,其中大部分问题需要应用至少一种额外技能,如过滤、数学运算或单位转换以生成答案。数据集的构建遵循了五步自动化收集流程,首先扩展QAMPARI问题,通过查询Wikidata知识图谱来增加额外的关系,然后从Wikipedia收集支持证据,接着使用PaLM-2评估证据并生成答案表格。随后通过PaLM-2模型对问题进行重述,以提高自然性,最后为了生成更具挑战性的问题,对TANQ问题进行了技能增强,如过滤、转换和近似计算。TANQ数据集适用于开发和评估能够处理多步推理、数学运算和单位转换等复杂任务的大模型。

详情请参见五号雷达:https://www.5radar.com/result?key=TANQ

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们