five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

布朗大学 发布 NEWTS 数据集, 应用在 新闻摘要、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 13:2049
NEWTS 是 布朗大学 发布的数据集,于 2022-05-31 首发在 arXiv 应用于 新闻摘要、自然语言处理 领域

布朗大学 本次发布的数据集 NEWTS, NEWTS数据集是由布朗大学计算机科学系和洛桑联邦理工学院机器学习和优化实验室共同创建的,专注于新闻主题聚焦摘要的首个数据集。该数据集基于著名的CNN/Dailymail数据集,通过在线众包方式增加了新的主题聚焦摘要。数据集包含3000篇新闻文章,每篇文章配有两个主题聚焦的人工编写摘要,共计6000条摘要。NEWTS数据集的创建旨在支持主题聚焦摘要的研究,特别是在控制文本生成领域,以解决现有摘要数据集在主题多样性和个性化需求方面的不足。

查看NEWTS

README 内容: 

 

关于 布朗大学 , 布朗大学是一所位于美国罗德岛州普罗维登斯的私立研究型大学,成立于1764年,是美国常春藤联盟成员之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们