摩根大通 本次发布的数据集 QBD-RANKEDDATAGEN, QBD-RANKEDDATAGEN是一个用于生成定制排名数据集的过程,旨在提高基于文档查询的搜索性能。该数据集由摩根大通AI研究创建,旨在通过使用大型语言模型(LLMs)对文档进行重新排序,以减少人工工作量的同时,仍能获得足够的专家知识来调整检索模型。该数据集已在文本检索会议(TREC)的QBD数据集上进行评估,并通过调整BM25模型的参数来优化检索结果。数据集适用于需要文档匹配的任务,如专利匹配、法律案例检索和学术文献审查等。QBD-RANKEDDATAGEN通过引入LLM重新排序技术,实现了在生成定制排名数据集的过程中,有效减少人工专家的工作量,并允许在数据集中嵌入专家知识,从而优化检索模型和候选重新排序的性能。
关于 摩根大通 , 摩根大通是是一家全球性的金融服务公司,提供广泛的银行和金融服务,包括投资银行、商业银行、资产和财富管理等。其AI研究部门专注于利用人工智能技术改进金融服务和客户体验。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)