five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

Webis Group 发布 tip-of-my-tongue-known-item-search-triplets 数据集, 应用在 信息检索、监督学习 领域

五号数据雷达开源数据市场2024-12-13 02:5123
tip-of-my-tongue-known-item-search-triplets 是 Webis Group 发布的数据集,于 2024-11-14 首发在 HuggingFace 应用于 信息检索、监督学习 领域

Webis Group 本次发布的数据集 tip-of-my-tongue-known-item-search-triplets, TOMT-KIS-TRIPLETS数据集是TOMT-KIS数据集的精炼子集,专注于包含指向Wikipedia或IMDb链接的问题。该数据集旨在用于监督学习任务,提供与相关Wikipedia文章的直接链接。数据集包含查询ID、查询文本、正负文档的文档ID、Wikipedia URL以及Wikipedia文章的内容等字段。数据集经过处理以确保相关性和一致性,根据TREC-ToT 2024标准过滤掉有偏见的条目。

查看tip-of-my-tongue-known-item-search-triplets

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 Webis Group , Webis Group是一家专注于网络数据挖掘、自然语言处理和社交媒体分析的学术研究机构,致力于通过先进技术手段对互联网信息进行深度分析和应用。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们