five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

印度理工学院 发布 IL-PCSR 数据集, 应用在 法律信息检索、印度法律 领域

五号数据雷达开源数据市场2025-11-07 07:2123
IL-PCSR 是 印度理工学院 发布的数据集,于 2025-11-01 首发在 arXiv 应用于 法律信息检索、印度法律 领域

印度理工学院 本次发布的数据集 IL-PCSR, IL-PCSR是一个为印度法律领域量身定制的语料库,旨在解决法律案件中的法律条文检索和先前案例检索问题。该数据集包含6271个案例判决文档、936个法律条文和3183个先前案例,涵盖13个广泛的法律领域。数据集的构建过程涉及从印度Kanoon平台收集20,000份公开可用的英语案例判决书,并通过匿名化处理和事件掩码来防止模型与法律条文和案例标题相关联。IL-PCSR是第一个支持对同一查询并行识别相关法律条文和先前案例的数据集,为法律领域的信息检索模型开发提供了一个共同测试平台。

查看IL-PCSR

Dataset card 内容: 

 

Files and versions 内容: 

 

关于 印度理工学院 , 印度理工学院是印度的一个著名高等教育机构,以其高水平的教学和研究而闻名于世。卡纳普尔分校是其分校之一,也提供多种工程、科学和技术领域的课程与研究项目。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们