five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

首尔科技大学 发布 KoPolitic-Benchmark-Dataset 数据集, 应用在 文本分类、政治意图识别 领域

五号数据雷达开源数据市场2024-10-13 05:19124
KoPolitic-Benchmark-Dataset 是 首尔科技大学 发布的数据集,于 2023-11-03 首发在 arXiv 应用于 文本分类、政治意图识别 领域

首尔科技大学 本次发布的数据集 KoPolitic-Benchmark-Dataset, KoPolitic-Benchmark-Dataset是由首尔科技大学、庆熙大学和浦项科技大学联合创建的一个大型韩语文本分类数据集,旨在通过自动识别在线新闻文章中的政治意图来解决文本中隐含意图难以区分的问题。该数据集包含12,000篇新闻文章,均来自韩国六大最具代表性的报纸的政治版块,每篇文章都标注了政治倾向(自由或保守倾向)和亲政府程度,使用5点量表和6点量表进行评估。数据集的创建过程涉及人工标注和多轮交叉检查,确保数据的质量和平衡。该数据集主要应用于政治文本的自动分类,特别是在多任务学习框架下,同时处理政治倾向和亲政府程度的分类问题,为研究者提供了一个有效的工具来分析和理解新闻文章中的复杂政治信息。

查看KoPolitic-Benchmark-Dataset

README 内容: 

 

关于 首尔科技大学 , 首尔科技大学(Seoul National University of Science and Technology)是韩国的一所国立大学,位于首尔特别市,专注于工程技术和科学研究。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们