five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

伦敦玛丽女王大学 发布 MultiClaimNet 数据集, 应用在 多语言处理、事实核查 领域

五号数据雷达开源数据市场2025-04-03 07:0324
MultiClaimNet 是 伦敦玛丽女王大学 发布的数据集,于 2025-03-28 首发在 arXiv 应用于 多语言处理、事实核查 领域

伦敦玛丽女王大学 本次发布的数据集 MultiClaimNet, MultiClaimNet是一个包含三个多语言声明集群数据集的集合,由伦敦玛丽女王大学和Newtral Media Audiovisual等机构创建。该数据集包含了86种语言的话题广泛的声明,通过自动化的方式从声明匹配对中形成声明集群,并以有限的人工干预进行构建。最大的数据集包含85,300条经过验证的声明,这些声明以78种语言写成。该数据集的构建旨在解决声明聚类的问题,以提高声明检索和验证的效率,为自动化的事实核查管道提供可扩展的解决方案。

查看MultiClaimNet

关于 伦敦玛丽女王大学 , 伦敦玛丽女王大学是英国的一所著名公立研究型大学,位于伦敦,是伦敦大学的成员之一。该校在多个学科领域享有盛誉,尤其在法律、医学和工程学方面表现突出。数字音乐中心是其下属的一个专注于数字音乐研究和教育的机构。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们