five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

伦敦玛丽女王大学 发布 TM-Senti 数据集, 应用在 情感分析、社交媒体数据 领域

五号数据雷达开源数据市场2024-10-13 17:24128
TM-Senti 是 伦敦玛丽女王大学 发布的数据集,于 2023-02-14 首发在 arXiv 应用于 情感分析、社交媒体数据 领域

伦敦玛丽女王大学 本次发布的数据集 TM-Senti, TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

查看TM-Senti

关于 伦敦玛丽女王大学 , 伦敦玛丽女王大学(Queen Mary University of London)是英国伦敦大学系统中的一所公立研究型大学,成立于1887年,位于伦敦东部的Mile End。该校在多个学科领域享有国际声誉,尤其在医学、法律、工程和人文科学方面表现突出。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们