不列颠哥伦比亚大学 本次发布的数据集 Gazelle, Gazelle数据集是由不列颠哥伦比亚大学和MBZUAI共同创建的,专门用于阿拉伯语写作辅助的综合数据集。该数据集包含1433条数据,涵盖了阿拉伯语写作中的多种任务,如语法错误修正、多词表达、文本精炼等。数据集的创建过程包括手动翻译和从多个在线资源中精选数据,确保了数据的高质量和多样性。Gazelle数据集的应用领域主要集中在阿拉伯语写作辅助工具的开发,旨在解决阿拉伯语在AI写作工具开发中数据稀缺的问题,提升AI在阿拉伯语写作中的表现。
关于 不列颠哥伦比亚大学 , 不列颠哥伦比亚大学(University of British Columbia,简称UBC)是加拿大著名的公立研究型大学,位于加拿大不列颠哥伦比亚省温哥华市。该校在全球大学排名中名列前茅,尤其在工程、计算机科学、商学和环境科学等领域享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)