首页 / 开源数据市场 / 正文

印度理工学院孟买分校发布 Challenge Dataset of Cognates and False Friend Pairs from Indian Languages 数据集, 应用在自然语言处理、语言学领域

五号数据雷达开源数据市场2024-10-13 06:2336

Challenge Dataset of Cognates and False Friend Pairs from Indian Languages 是印度理工学院孟买分校发布的数据集,于 2021-12-17 首发在 arXiv 应用于自然语言处理、语言学领域

印度理工学院孟买分校本次发布的数据集 Challenge Dataset of Cognates and False Friend Pairs from Indian Languages, 本数据集名为‘印度语言中的同源词和假朋友对挑战数据集’，由印度理工学院孟买分校创建，涵盖了十二种印度语言的同源词数据。数据集通过数字化印度语言同源词词典并利用关联的印度语言Wordnets生成同源词集合。此外，还创建了一个假朋友数据集，用于十一对语言。数据集主要用于支持机器翻译、跨语言信息检索和计算系统发生学等自然语言处理应用，旨在解决不同语言间同源词识别的挑战。

查看Challenge Dataset of Cognates and False Friend Pairs from Indian Languages

README 内容：

关于印度理工学院孟买分校 , 印度理工学院孟买分校是印度顶尖的工程学院之一，以其在工程、科技和管理领域的卓越教育和研究而闻名。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

印度理工学院孟买分校 发布 Challenge Dataset of Cognates and False Friend Pairs from Indian Languages 数据集, 应用在 自然语言处理、语言学 领域

README 内容：

社区讨论

印度理工学院孟买分校发布 Challenge Dataset of Cognates and False Friend Pairs from Indian Languages 数据集, 应用在自然语言处理、语言学领域