达卡大学 本次发布的数据集 BanglaBias, BanglaBias是一个包含200篇政治意义显著且高度争议的孟加拉语新闻文章的基准数据集,这些文章被标记为政府倾向、政府批评和中立立场。该数据集为评估大型语言模型(LLMs)提供了诊断分析。数据集的创建过程包括从多个新闻来源和博客收集政治上有争议的事件,然后由三位母语为孟加拉语的人对这些文章进行标注。BanglaBias旨在解决孟加拉语新闻中政治立场检测的挑战,并为低资源环境中的LLM性能改进提供见解。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)