国家药物滥用研究所 本次发布的数据集 Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021, 本数据集名为‘Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021’,由国家药物滥用研究所和美国宾夕法尼亚大学共同创建。数据集包含了6390万条推文,涉及#BlackLivesMatter、#AllLivesMatter和#BlueLivesMatter等关键词,覆盖了全球超过100个国家。创建过程中,通过Twitter API收集了从2013年至2021年的推文数据,并使用Latent Dirichlet Allocation (LDA) 技术分析了语言模式。该数据集主要用于研究计算社会科学、通信、政治科学、自然语言处理和机器学习等领域,旨在解决系统性种族主义、社会运动、草根运动、种族不平等、警察暴力和反对运动等问题。
查看Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021
关于 国家药物滥用研究所 , 国家药物滥用研究所是一个专注于药物滥用问题研究、预防和治疗的机构,致力于通过科学研究和社会干预来减少药物滥用对个人和社会的危害。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)