CUAD 本次发布的数据集 LegalCore, 该数据集名为LegalCore,是首个在法律领域标注了全面的事件及事件共指信息的数据集。它包含了100份法律合同文件,总计有23,183个事件提及。该数据集对目前最先进的开源和专有大型语言模型(LLM)提出了重大挑战,事件提及的标注者间一致性达到80.2%,并且在本地和非本地共指链接方面拥有多样的统计数据。数据集规模为100份法律合同文件,每份文件平均含有25,000个词元。其任务旨在进行事件检测和事件共指解析。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)