five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

麦吉尔大学 发布 INJONGO 数据集, 应用在 自然语言处理、跨语言学习 领域

五号数据雷达开源数据市场2025-02-18 06:4812
INJONGO 是 麦吉尔大学 发布的数据集,于 2025-02-14 首发在 arXiv 应用于 自然语言处理、跨语言学习 领域

麦吉尔大学 本次发布的数据集 INJONGO, INJONGO是一个包含16种非洲语言及英语的多元文化意图检测和槽填充数据集,由麦吉尔大学等机构创建。该数据集涵盖了银行、家居、旅行、公用事业和餐饮等五个领域,每个非洲语言包含3200个标注实例。数据集通过提供CLINC数据集中的句子,并由母语者生成文化相关的句子和相关的槽实体来构建。该数据集旨在促进跨语言从英语到非洲低资源语言的转移学习,并改进下游性能。

查看INJONGO

README 内容: 

 

关于 麦吉尔大学 , 麦吉尔大学(McGill University)是位于加拿大魁北克省蒙特利尔市的一所顶尖研究型大学,学校成立于1821年,是加拿大最古老的高等学府之一,也是世界著名的学术机构。麦吉尔大学在多个学科领域享有很高的声誉,尤其在医学、自然科学、工程学和人文社会科学等方面表现突出。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们