five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

TurkuNLP Research Group发布FSLDR数据集,应用在多语言文本检索、自然语言处理领域

五号数据雷达开源数据市场2026-04-23 05:416
FSLDR是TurkuNLP Research Group发布的数据集,于2026-04-22首发在HuggingFace应用于多语言文本检索、自然语言处理领域

TurkuNLP Research Group本次发布的数据集FSLDR,该数据集是一个多语言文本检索数据集,包含芬兰语(fin)和瑞典语(swe)两种语言。数据来源于HPLT/HPLT3.0项目,采用人工标注方式构建,并以CC0-1.0协议开源。数据集主要配置包括:芬兰语和瑞典语的语料库(corpus)、查询语句(queries)、相关性评估(qrels)及其元数据(meta),每种配置均包含开发集(dev)和测试集(test)划分。该数据集适用于多语言文本检索相关的研究与开发任务。

查看FSLDR

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们