five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

安特卫普大学 发布 bBSARD 数据集, 应用在 法律检索、多语言处理 领域

五号数据雷达开源数据市场2024-12-12 07:2121
bBSARD 是 安特卫普大学 发布的数据集,于 2024-12-10 首发在 arXiv 应用于 法律检索、多语言处理 领域

安特卫普大学 本次发布的数据集 bBSARD, bBSARD数据集是基于比利时法定条文检索数据集(BSARD)扩展的双语版本,包含法语和荷兰语的平行法律条文,旨在解决比利时多语言法律检索的挑战。数据集包含22417条法律条文和1108个法律问题,问题主要涉及家庭、住房、金钱等主题。数据集通过从比利时联邦政府的Justel数据库中抓取法语和荷兰语的条文,并使用GPT-4进行自动翻译和人工校对创建。该数据集主要用于评估和改进荷兰语和法语的法律检索模型,特别是在多语言法律环境中的应用。

查看bBSARD

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 安特卫普大学 , 安特卫普大学是比利时的一所著名大学,位于安特卫普市,提供广泛的学术课程和研究项目,涵盖人文、社会科学、自然科学和工程等多个领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们