国际信息研究所 本次发布的数据集 印度政治讨论Reddit数据集, 该数据集由国际信息研究所,海得拉巴大学创建,专注于印度政治语境,保留了政治讨论中争议性内容与非性争议内容的自然分布。数据集包含57,721条原始帖子,经过筛选后共有20,245条,其中12.9%为争议性帖子。数据集涵盖了7个关注印度政治的最热门Reddit子版块,反映了印度政治讨论的多样性。数据集适用于争议性内容检测,旨在解决在线政治讨论中的新兴叙事识别、意见泡沫分析和在线社区两极化评估等问题。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)