five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

俄罗斯圣彼得堡国立信息技术机械与光学大学 发布 ASOIF和HP系列小说词汇嵌入评估数据集 数据集, 应用在 词汇嵌入、数字人文 领域

五号数据雷达开源数据市场2024-10-13 04:4046
ASOIF和HP系列小说词汇嵌入评估数据集 是 俄罗斯圣彼得堡国立信息技术机械与光学大学 发布的数据集,于 2019-03-07 首发在 arXiv 应用于 词汇嵌入、数字人文 领域

俄罗斯圣彼得堡国立信息技术机械与光学大学 本次发布的数据集 ASOIF和HP系列小说词汇嵌入评估数据集, 本数据集由俄罗斯圣彼得堡国立信息技术机械与光学大学软件工程与计算机系统学院的研究团队创建,专注于评估在数字人文领域中词汇嵌入技术的性能。数据集基于两部流行的奇幻小说系列:乔治·R·R·马丁的《冰与火之歌》和J.K.罗琳的《哈利·波特》。数据集包含31474个评估单元,用于测试词汇相似性和词汇侵入等任务。创建过程中,研究团队使用了多种词汇嵌入模型,并手动构建了高质量的测试数据集。该数据集旨在为未来的研究提供基准,并解决特定领域和较小语料库中词汇嵌入模型的性能问题。

查看ASOIF和HP系列小说词汇嵌入评估数据集

README 内容: 

 

关于 俄罗斯圣彼得堡国立信息技术机械与光学大学 , 俄罗斯圣彼得堡国立信息技术机械与光学大学(ITMO University)是俄罗斯的一所著名高等教育机构,专注于信息技术、机械工程和光学领域的教育和研究。该大学在计算机科学、工程技术和光学研究方面具有很高的国际声誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们