欧洲大学圣彼得堡分校 本次发布的数据集 俄罗斯法律开放数据, 俄罗斯法律开放数据是由欧洲大学圣彼得堡分校法律研究所创建的综合性数据集,收录了1991年至2023年的281,413份非秘密联邦法规和法案文本,总计176,523,268个tokens。数据集包含两个版本:原始文本和为语言分析准备的带有形态句法标记的版本。创建过程涉及从俄罗斯立法网站抓取原始文本,并进行形态句法标记处理。该数据集主要用于法律文本的复杂性和可读性研究,旨在解决法律文本分析中的语言学问题。
README 内容:
关于 欧洲大学圣彼得堡分校 , 欧洲大学圣彼得堡分校是位于俄罗斯圣彼得堡的一所高等教育机构,专注于提供高质量的教育和研究机会。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)