首尔国立大学 本次发布的数据集 KoCoNovel, KoCoNovel是由首尔国立大学开发的一个大型韩语文学文本中的角色共指数据集,包含来自50部现代和当代韩国小说的178,000个词汇。该数据集是首个基于文学文本的韩语共指解析语料库,特别关注韩语中的称呼文化,其中24%的角色提及是单一的普通名词。KoCoNovel提供四个不同版本,以适应广泛的文学共指分析需求,支持全知作者或读者的视角,并处理多个实体作为单独或重叠实体,从而扩大其适用性。数据集的创建过程涉及详细的预处理和标注,旨在通过整合韩国文化和语言动态,显著提升共指解析模型的性能。
关于 首尔国立大学 , 首尔国立大学是韩国最顶级的公立研究型综合大学,以其卓越的教学和科研实力享誉全球。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)