five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

国家药物滥用研究所 发布 Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021 数据集, 应用在 社会运动、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 10:4344
Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021 是 国家药物滥用研究所 发布的数据集,于 2022-06-07 首发在 arXiv 应用于 社会运动、自然语言处理 领域

国家药物滥用研究所 本次发布的数据集 Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021, 本数据集名为‘Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021’,由国家药物滥用研究所和美国宾夕法尼亚大学共同创建。数据集包含了6390万条推文,涉及#BlackLivesMatter、#AllLivesMatter和#BlueLivesMatter等关键词,覆盖了全球超过100个国家。创建过程中,通过Twitter API收集了从2013年至2021年的推文数据,并使用Latent Dirichlet Allocation (LDA) 技术分析了语言模式。该数据集主要用于研究计算社会科学、通信、政治科学、自然语言处理和机器学习等领域,旨在解决系统性种族主义、社会运动、草根运动、种族不平等、警察暴力和反对运动等问题。

查看Twitter Corpus of the #BlackLivesMatter Movement and Counter Protests: 2013 to 2021

关于 国家药物滥用研究所 , 国家药物滥用研究所是一个专注于药物滥用问题研究、预防和治疗的机构,致力于通过科学研究和社会干预来减少药物滥用对个人和社会的危害。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们