five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

欧洲大学圣彼得堡分校 发布 俄罗斯法律开放数据 数据集, 应用在 法律文本、语言学分析 领域

五号数据雷达开源数据市场2024-10-13 16:4433
俄罗斯法律开放数据 是 欧洲大学圣彼得堡分校 发布的数据集,于 2024-06-07 首发在 arXiv 应用于 法律文本、语言学分析 领域

欧洲大学圣彼得堡分校 本次发布的数据集 俄罗斯法律开放数据, 俄罗斯法律开放数据是由欧洲大学圣彼得堡分校法律研究所创建的综合性数据集,收录了1991年至2023年的281,413份非秘密联邦法规和法案文本,总计176,523,268个tokens。数据集包含两个版本:原始文本和为语言分析准备的带有形态句法标记的版本。创建过程涉及从俄罗斯立法网站抓取原始文本,并进行形态句法标记处理。该数据集主要用于法律文本的复杂性和可读性研究,旨在解决法律文本分析中的语言学问题。

查看俄罗斯法律开放数据

README 内容: 

 

关于 欧洲大学圣彼得堡分校 , 欧洲大学圣彼得堡分校是位于俄罗斯圣彼得堡的一所高等教育机构,专注于提供高质量的教育和研究机会。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们