本次发布的数据集 Keyword Extraction Datasets, 该数据集是一组针对关键短语提取组织的不同数据集,按领域类型分类,涵盖了新闻、研究论文、报告、网页、问答以及推文等多个领域。这些数据集主要以英语为主,包含了有助于理解关键短语预测趋势的统计信息。规模各异,旨在支持关键短语提取任务。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)