five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

苏黎世大学 发布 SwissGov-RSD 数据集, 应用在 跨语言语义分析、自然语言处理 领域

五号数据雷达开源数据市场2025-12-11 00:0224
SwissGov-RSD 是 苏黎世大学 发布的数据集,于 2025-12-08 首发在 arXiv 应用于 跨语言语义分析、自然语言处理 领域

苏黎世大学 本次发布的数据集 SwissGov-RSD, SwissGov-RSD是由苏黎世大学团队构建的首个跨语言文档级语义差异标注数据集,源自瑞士政府门户网站admin.ch的多语言平行文本。该数据集包含224组英德、英法、英意三语对文档,共计约17-19万Tokens,通过人工标注实现细粒度的token级差异标注(0-5分制)。数据经过严格筛选与双人交叉验证,标注一致性在EN-IT语对表现最佳(F1=55.6)。该数据集旨在解决跨语言内容对齐、机器翻译评估等任务中真实场景下的语义差异检测难题,为自然语言理解研究提供重要基准。

查看SwissGov-RSD

Files and versions 内容: 

 

关于 苏黎世大学 , 苏黎世大学(University of Zurich)是瑞士最大的综合性大学,成立于1833年,位于瑞士苏黎世。该校在医学、免疫学、遗传学、神经科学、结构生物学及经济学等领域享有盛誉,拥有包括第一届诺贝尔物理学奖得主伦琴在内的多位诺贝尔奖得主。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们