five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

ACL Anthology 发布 LimGen 数据集, 应用在 自然语言处理、文本生成 领域

五号数据雷达开源数据市场2025-10-03 13:1414
LimGen 是 ACL Anthology 发布的数据集,于 2025-10-03 首发在 arXiv 应用于 自然语言处理、文本生成 领域

ACL Anthology 本次发布的数据集 LimGen, 该数据集名为LimGen,包含了4068篇来自ACL选集的研究论文及其相关的局限性信息,旨在辅助研究论文的“建议性局限性生成”(SLG)任务。该数据集通过抓取2022年至2023年间EMNLP、ACL和EACL会议的论文集编制而成,仅包括那些含有“局限性”部分的论文,从而为分析和生成研究论文的局限性提供了一个结构化的数据集。规模上,该数据集涵盖了4068篇研究论文,其任务重点在于“建议性局限性生成”(SLG)。

查看LimGen

README 内容: 

 

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们