Webis Group 本次发布的数据集 tip-of-my-tongue-known-item-search, TOMT-KIS数据集是从r/tipofmytongue子版块收集的大规模已知项目问题集合,专注于用户无法通过搜索引擎解决信息需求并转向问答平台寻求帮助的情况。该数据集包含128万个问题,每个问题具有多种属性,包括问题的唯一标识符、标题、内容、创建时间戳以及问题是否已解决的标志。此外,对于标记为已解决的问题,数据集还包括检测到的答案、答案的时间戳以及讨论中提到的外部资源链接。数据集以JSONL格式提供,旨在用于已知项目问题性能预测的研究。
查看tip-of-my-tongue-known-item-search
Dataset card 内容:
Files and versions 内容:
关于 Webis Group , Webis Group是一家专注于网络数据挖掘、自然语言处理和社交媒体分析的学术研究机构,致力于通过先进技术手段对互联网信息进行深度分析和应用。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)