five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

耶鲁大学 发布 Multi-News 数据集, 应用在 新闻摘要、自然语言处理 领域

五号数据雷达开源数据市场2024-10-13 07:2040
Multi-News 是 耶鲁大学 发布的数据集,于 2019-06-20 首发在 arXiv 应用于 新闻摘要、自然语言处理 领域

耶鲁大学 本次发布的数据集 Multi-News, Multi-News是由耶鲁大学计算机科学系创建的第一个大规模多文档新闻摘要数据集,包含56,216个文章-摘要对。该数据集从newser.com收集新闻文章和专业编辑编写的人工摘要,旨在解决多文档新闻事件的全面和非冗余摘要挑战。数据集内容丰富,涵盖超过1,500个新闻来源,适用于训练和测试多文档摘要模型,特别是在处理不同焦点和观点的新闻事件时。

查看Multi-News

README 内容: 

 

关于 耶鲁大学 , 耶鲁大学是一所位于美国康涅狄格州纽黑文市的私立研究型大学,成立于1701年,是美国历史最悠久的高等教育机构之一,也是常春藤联盟成员之一。耶鲁大学以其卓越的学术研究和教育质量闻名,尤其在人文科学、社会科学、自然科学和工程学等领域具有显著影响力。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们