five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

西波西米亚大学 发布 Czech News Dataset for Semantic Textual Similarity 数据集, 应用在 语义相似度、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 02:1030
Czech News Dataset for Semantic Textual Similarity 是 西波西米亚大学 发布的数据集,于 2022-01-21 首发在 arXiv 应用于 语义相似度、自然语言处理 领域

西波西米亚大学 本次发布的数据集 Czech News Dataset for Semantic Textual Similarity, Czech News Dataset for Semantic Textual Similarity是由西波西米亚大学应用科学学院计算机科学与工程系创建的一个大型数据集,包含138,556条从捷克新闻领域提取的句子对,每个句子对都有两种语义相似度标注:有上下文和无上下文。该数据集旨在训练和评估预测句子语义相似度的系统。数据集的创建过程涉及485名新闻学学生的参与,并通过计算平均注释分数来提高测试集的可靠性。该数据集特别适用于研究上下文对语义相似度评估的影响,并已用于训练高性能的语义相似度预测模型。

查看Czech News Dataset for Semantic Textual Similarity

关于 西波西米亚大学 , 西波西米亚大学是捷克共和国的一所公立大学,位于比尔森市,提供广泛的学术课程和研究机会,涵盖自然科学、工程、人文和社会科学等领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们