TREC 本次发布的数据集 TREC DL 2023 passage ranking, 该数据集包含了人类提出的以及合成生成的查询问题,并附有人类专家和大型语言模型(LLM)的评估注释。这些查询问题总数为82条,其中包括51条由人类提出的真实问题,18条由GPT-4生成的问题,以及13条由T5生成的问题。评估采用了4点相关度量表,数据集中包含了1830条完全相关(3分),2259条高度相关(2分),4372条相关(1分),以及13866条不相关评估。这82条查询问题具有多个相关性评估,该数据集的任务是信息检索评估。
查看TREC DL 2023 passage ranking
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)