five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

CUAD 发布 LegalCore 数据集, 应用在 法律信息处理、自然语言处理 领域

五号数据雷达开源数据市场2025-10-01 19:0422
LegalCore 是 CUAD 发布的数据集,于 2025-10-01 首发在 arXiv 应用于 法律信息处理、自然语言处理 领域

CUAD 本次发布的数据集 LegalCore, 该数据集名为LegalCore,是首个在法律领域标注了全面的事件及事件共指信息的数据集。它包含了100份法律合同文件,总计有23,183个事件提及。该数据集对目前最先进的开源和专有大型语言模型(LLM)提出了重大挑战,事件提及的标注者间一致性达到80.2%,并且在本地和非本地共指链接方面拥有多样的统计数据。数据集规模为100份法律合同文件,每份文件平均含有25,000个词元。其任务旨在进行事件检测和事件共指解析。

查看LegalCore

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们