five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

无处不在的知识处理实验室(UKP-TUDA) 发布 Benchmarking-IR (BEIR) 数据集, 应用在 信息检索、性能评估 领域

五号数据雷达开源数据市场2024-10-13 09:23164
Benchmarking-IR (BEIR) 是 无处不在的知识处理实验室(UKP-TUDA) 发布的数据集,于 2021-10-21 首发在 arXiv 应用于 信息检索、性能评估 领域

无处不在的知识处理实验室(UKP-TUDA) 本次发布的数据集 Benchmarking-IR (BEIR), BEIR是一个包含18个不同文本检索任务的数据集,由无处不在的知识处理实验室(UKP-TUDA)创建。数据集涵盖了从事实检查到新闻检索等多个领域,旨在评估信息检索模型在零样本设置下的泛化能力。BEIR数据集包括多种数据类型,如新闻文章、推文和科学出版物,以及不同大小的数据集,从3.6k到15M文档不等。数据集的创建过程涉及对公开可用数据集的精心选择,以确保多样性和挑战性。BEIR的应用领域广泛,旨在解决模型在未见领域和任务上的性能评估问题,推动信息检索系统的鲁棒性和泛化能力的进步。

查看Benchmarking-IR (BEIR)

README 内容: 

 

关于 无处不在的知识处理实验室(UKP-TUDA) , -

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们