Lawa.AI 本次发布的数据集 Fann or Flop, Fann or Flop数据集是首个用于评估语言模型对阿拉伯诗歌理解能力的基准数据集。它涵盖了从古典结构到当代自由诗的各种形式,包括12个历史时期和21个核心诗歌体裁。数据集由经过专家验证的诗歌和解释组成,用于评估语义理解、隐喻解释、韵律意识和文化背景。数据集旨在解决语言模型在理解阿拉伯诗歌方面的挑战,并作为评估模型在阿拉伯诗歌理解方面深度和文化敏感性的指标。数据集的发布为阿拉伯语言模型的发展和评估提供了开源资源。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)