TurkuNLP Research Group本次发布的数据集FSLDR,该数据集是一个多语言文本检索数据集,包含芬兰语(fin)和瑞典语(swe)两种语言。数据来源于HPLT/HPLT3.0项目,采用人工标注方式构建,并以CC0-1.0协议开源。数据集主要配置包括:芬兰语和瑞典语的语料库(corpus)、查询语句(queries)、相关性评估(qrels)及其元数据(meta),每种配置均包含开发集(dev)和测试集(test)划分。该数据集适用于多语言文本检索相关的研究与开发任务。


TurkuNLP Research Group本次发布的数据集FSLDR,该数据集是一个多语言文本检索数据集,包含芬兰语(fin)和瑞典语(swe)两种语言。数据来源于HPLT/HPLT3.0项目,采用人工标注方式构建,并以CC0-1.0协议开源。数据集主要配置包括:芬兰语和瑞典语的语料库(corpus)、查询语句(queries)、相关性评估(qrels)及其元数据(meta),每种配置均包含开发集(dev)和测试集(test)划分。该数据集适用于多语言文本检索相关的研究与开发任务。
