库姆大学 本次发布的数据集 FarsTail, FarsTail是首个针对波斯语的自然语言推理(NLI)数据集,由伊朗库姆大学的研究团队开发。该数据集包含10,367个样本,源自3,539个多选题,旨在提供真实的语言使用场景。数据集的创建过程经过精心设计,确保数据质量,包括从网络提取文本片段以形成假设,并通过多轮标注确保一致性。FarsTail不仅适用于NLI任务,还可用于问答、摘要、语义搜索和机器翻译等多个领域,旨在推动波斯语及其他数据稀缺语言的NLP技术发展。
README 内容:
关于 库姆大学 , 库姆大学位于伊朗,是一所综合性大学,提供包括计算机工程与IT系在内的多个学科的教育和研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)