首页 / 开源数据市场 / 正文

PAN 2017 Author Profiling shared task committee 发布 PAN 2017 Author Profiling Dataset 数据集, 应用在文本分析、语言识别领域

五号数据雷达开源数据市场2025-10-07 08:1316

PAN 2017 Author Profiling Dataset 是 PAN 2017 Author Profiling shared task committee 发布的数据集,于 2025-10-07 首发在 arXiv 应用于文本分析、语言识别领域

PAN 2017 Author Profiling shared task committee 本次发布的数据集 PAN 2017 Author Profiling Dataset, 该数据集包含了每位作者用4种不同语言编写的100条推文，旨在用于性别和母语识别任务。数据集以XML格式构建，并附带一个包含性别和语言变体类别的真实文件。根据所使用的最小文档频率，分类模型的性能有所不同。该数据集的规模为400条推文（每位作者100条），任务包括性别预测和母语识别。

查看PAN 2017 Author Profiling Dataset

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

PAN 2017 Author Profiling shared task committee 发布 PAN 2017 Author Profiling Dataset 数据集, 应用在 文本分析、语言识别 领域

社区讨论

PAN 2017 Author Profiling shared task committee 发布 PAN 2017 Author Profiling Dataset 数据集, 应用在文本分析、语言识别领域