博科尼大学 本次发布的数据集 DADIT, DADIT数据集是由博科尼大学创建的一个包含20,000个意大利Twitter用户及其3000万条推文的数据集。该数据集不仅包括用户的个人简介和头像,还提供了高质量的性别、年龄和地理位置标签,其中43%的用户有地理位置信息。数据集的创建过程涉及通过Twitter API收集数据,并手动验证性别和年龄标签的准确性。DADIT数据集主要用于训练和比较不同性别和年龄预测模型的性能,特别是在社交媒体用户的人口统计分类任务中。
Dataset card 内容:
Files and versions 内容:
关于 博科尼大学 , 博科尼大学(Bocconi University)位于意大利米兰,是一所专注于经济学、管理学、法学和社会科学的世界知名私立大学。该校成立于1902年,以其卓越的教育质量和研究成果在国际上享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)