five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

德累斯顿工业大学 发布 BanglaQuAD 数据集, 应用在 自然语言处理、问答系统 领域

五号数据雷达开源数据市场2024-10-16 07:0630
BanglaQuAD 是 德累斯顿工业大学 发布的数据集,于 2024-10-14 首发在 arXiv 应用于 自然语言处理、问答系统 领域

德累斯顿工业大学 本次发布的数据集 BanglaQuAD, BanglaQuAD是由BanglaAI和德累斯顿工业大学合作创建的一个高质量的孟加拉语开放领域问答数据集。该数据集包含30,808个由母语者标注的问题-答案对,基于孟加拉语维基百科的658篇文章构建。数据集的创建过程包括文章筛选、文本清洗和人工标注,确保了数据的高质量。BanglaQuAD涵盖了广泛的词汇和问题类型,旨在用于机器阅读理解和信息检索任务,以解决孟加拉语自然语言处理中的低资源问题。

查看BanglaQuAD

README 内容: 

 

关于 德累斯顿工业大学 , 德累斯顿工业大学(Technische Universität Dresden)是德国的一所著名理工科大学,位于萨克森州首府德累斯顿。该校成立于1828年,是德国历史最悠久的工业大学之一,也是欧洲顶尖的技术大学联盟(TU9)的成员之一。德累斯顿工业大学在工程学、自然科学、医学和经济学等领域享有盛誉,尤其在微电子、材料科学和环境工程方面具有显著优势。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们