Webis Group 本次发布的数据集 tip-of-my-tongue-known-item-search-triplets, TOMT-KIS-TRIPLETS数据集是TOMT-KIS数据集的精炼子集,专注于包含指向Wikipedia或IMDb链接的问题。该数据集旨在用于监督学习任务,提供与相关Wikipedia文章的直接链接。数据集包含查询ID、查询文本、正负文档的文档ID、Wikipedia URL以及Wikipedia文章的内容等字段。数据集经过处理以确保相关性和一致性,根据TREC-ToT 2024标准过滤掉有偏见的条目。
查看tip-of-my-tongue-known-item-search-triplets
Dataset card 内容:
Files and versions 内容:
关于 Webis Group , Webis Group是一家专注于网络数据挖掘、自然语言处理和社交媒体分析的学术研究机构,致力于通过先进技术手段对互联网信息进行深度分析和应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)