本次发布的数据集 Bharat_NanoArguAna_as, 该数据集是Bharat-NanoBEIR集合的一部分,专门为印度语言的信息检索任务设计,特别是阿萨姆语。它是从NanoBEIR项目派生出来的,NanoBEIR项目提供了包含50个查询和最多10K个文档的BEIR数据集的较小版本。此特定数据集是NanoArguAna数据集的阿萨姆语版本,专门为信息检索任务进行了调整。翻译和改编保持了原始NanoBEIR的核心结构,同时使其适用于阿萨姆语处理。数据集包含三个主要部分:语料库(阿萨姆语文档集合)、查询(阿萨姆语搜索查询)和QRels(连接查询到相关文档的相关性判断)。
Dataset card 内容:
Files and versions 内容:
关于 , 国庆学校是一所位于中国的教育机构,专注于提供基础教育服务。学校致力于培养学生的综合素质,注重学术与品德的全面发展。
关于 HuggingFace , Hugging Face是一个机器学习社区协作平台,专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型,包括文本、图像、视频、音频和3D数据,并提供开源工具和付费计算及企业解决方案。





_1769672084863.jpg)