首页 / 开源数据市场 / 正文

Laboratory of Language Technology at Tallinn University of Technology 发布 EstQA 数据集, 应用在问答系统、自然语言处理领域

五号数据雷达开源数据市场2024-12-12 17:0621

EstQA 是 Laboratory of Language Technology at Tallinn University of Technology 发布的数据集,于 2024-08-22 首发在 HuggingFace 应用于问答系统、自然语言处理领域

Laboratory of Language Technology at Tallinn University of Technology 本次发布的数据集 EstQA, EstQA数据集是一个用于爱沙尼亚语抽取式问答的数据集，基于维基百科文章并通过PageRank预过滤。训练集包含776个上下文-问题-答案三元组，每个问题有多个可能的答案，每个答案在单独的三元组中。测试集包含603个样本，每个样本包含一个或多个正确答案，总共有892个正确答案。数据集版本1.2从之前的结构重构为扁平结构，版本1.1增加了一些更多的正确答案。

查看EstQA

Dataset card 内容：

Files and versions 内容：

关于 Laboratory of Language Technology at Tallinn University of Technology , Tallinn University of Technology的Laboratory of Language Technology是专注于语言技术研究的实验室，致力于开发和创新自然语言处理、语音识别及合成等先进技术。

关于 HuggingFace , Hugging Face是一个机器学习社区协作平台，专注于模型、数据集和应用程序的创建、发现和协作。该平台支持多种数据类型，包括文本、图像、视频、音频和3D数据，并提供开源工具和付费计算及企业解决方案。

社区讨论

近期热门

Laboratory of Language Technology at Tallinn University of Technology 发布 EstQA 数据集, 应用在 问答系统、自然语言处理 领域

Dataset card 内容：

Files and versions 内容：

社区讨论

Laboratory of Language Technology at Tallinn University of Technology 发布 EstQA 数据集, 应用在问答系统、自然语言处理领域