five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

摩根大通 发布 QBD-RANKEDDATAGEN 数据集, 应用在 信息检索、自然语言处理 领域

五号数据雷达开源数据市场2025-05-13 13:2524
QBD-RANKEDDATAGEN 是 摩根大通 发布的数据集,于 2025-05-08 首发在 arXiv 应用于 信息检索、自然语言处理 领域

摩根大通 本次发布的数据集 QBD-RANKEDDATAGEN, QBD-RANKEDDATAGEN是一个用于生成定制排名数据集的过程,旨在提高基于文档查询的搜索性能。该数据集由摩根大通AI研究创建,旨在通过使用大型语言模型(LLMs)对文档进行重新排序,以减少人工工作量的同时,仍能获得足够的专家知识来调整检索模型。该数据集已在文本检索会议(TREC)的QBD数据集上进行评估,并通过调整BM25模型的参数来优化检索结果。数据集适用于需要文档匹配的任务,如专利匹配、法律案例检索和学术文献审查等。QBD-RANKEDDATAGEN通过引入LLM重新排序技术,实现了在生成定制排名数据集的过程中,有效减少人工专家的工作量,并允许在数据集中嵌入专家知识,从而优化检索模型和候选重新排序的性能。

查看QBD-RANKEDDATAGEN

关于 摩根大通 , 摩根大通是是一家全球性的金融服务公司,提供广泛的银行和金融服务,包括投资银行、商业银行、资产和财富管理等。其AI研究部门专注于利用人工智能技术改进金融服务和客户体验。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们