卡内基梅隆大学本次发布的数据集Telegram Bots Dataset,该数据集由多所顶尖大学联合创建,是迄今为止规模最大的Telegram机器人及消息数据集,包含106,000个频道、809百万条消息和32,071个机器人信息。数据集通过雪球采样方法从现有公开数据集扩展而来,新增了67,000个频道和492百万条消息。数据内容涵盖机器人描述、功能交互记录以及频道间链接关系,特别关注了机器人在金融诈骗、非法服务等 illicit 活动中的角色。该数据集为研究人员提供了分析Telegram生态系统的基础资源,尤其适用于内容审核、网络安全和社交媒体行为研究等领域。
关于卡内基梅隆大学,卡内基梅隆大学是一所位于美国宾夕法尼亚州匹兹堡的私立研究型大学,以计算机科学、工程学和艺术等领域闻名。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)