印度理工学院 本次发布的数据集 IL-PCSR, IL-PCSR是一个为印度法律领域量身定制的语料库,旨在解决法律案件中的法律条文检索和先前案例检索问题。该数据集包含6271个案例判决文档、936个法律条文和3183个先前案例,涵盖13个广泛的法律领域。数据集的构建过程涉及从印度Kanoon平台收集20,000份公开可用的英语案例判决书,并通过匿名化处理和事件掩码来防止模型与法律条文和案例标题相关联。IL-PCSR是第一个支持对同一查询并行识别相关法律条文和先前案例的数据集,为法律领域的信息检索模型开发提供了一个共同测试平台。
Dataset card 内容:
Files and versions 内容:
关于 印度理工学院 , 印度理工学院是印度的一个著名高等教育机构,以其高水平的教学和研究而闻名于世。卡纳普尔分校是其分校之一,也提供多种工程、科学和技术领域的课程与研究项目。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)