GESIS – 莱布尼茨社会科学研究所 本次发布的数据集 FASSILA, FASSILA数据集是由阿尔及利亚方言(AD)的专家创建的,专门用于假新闻检测和情感分析。该数据集包含10,087个句子,涵盖超过19,497个独特的阿尔及利亚方言词汇,涉及七个不同的领域。数据集的创建过程包括从社交媒体平台(如Facebook和YouTube)收集数据,进行数据清洗和标注。FASSILA数据集的应用领域主要集中在阿尔及利亚方言的计算语言学研究,旨在解决假新闻检测和情感分析的问题,特别是在低资源语言环境中。
README 内容:
关于 GESIS – 莱布尼茨社会科学研究所 , GESIS – 莱布尼茨社会科学研究所是德国的一个社会科学研究机构,专注于社会科学领域的研究、数据服务和知识传播。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)