five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

奥尔堡大学 发布 跨语言共词化数据集 数据集, 应用在 多语言研究、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 06:5941
跨语言共词化数据集 是 奥尔堡大学 发布的数据集,于 2023-06-05 首发在 arXiv 应用于 多语言研究、自然语言处理 领域

奥尔堡大学 本次发布的数据集 跨语言共词化数据集, 跨语言共词化数据集是由奥尔堡大学哥本哈根计算机科学系的陈依依和约翰内斯·比尔瓦创建的,涵盖了142种语言和21个语系。该数据集包括了具体性和情感性的评分,并与音素和音韵特征相对应。数据集的创建过程涉及精细的编纂程序,旨在促进心理学、认知科学和多语言自然语言处理(NLP)等领域的跨学科研究。该数据集的应用领域广泛,旨在解决语言间的共词化模式及其对认知和情感表达的影响。

查看跨语言共词化数据集

README 内容: 

 

关于 奥尔堡大学 , 奥尔堡大学(Aalborg University)是丹麦的一所公立研究型大学,成立于1974年,位于丹麦北部的奥尔堡市。该校以其在工程、社会科学和健康科学等领域的研究和教育而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们