five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

复旦大学 发布 CoSER 数据集, 应用在 文学分析、自然语言处理 领域

五号数据雷达开源数据市场2025-02-15 07:1845
CoSER 是 复旦大学 发布的数据集,于 2025-02-13 首发在 arXiv 应用于 文学分析、自然语言处理 领域

复旦大学 本次发布的数据集 CoSER, CoSER数据集包含来自771部著名文学作品的17,966个角色的真实对话和丰富多样的数据类型,如对话场景、角色经验、内心思想等。该数据集通过LLM处理书籍内容而创建,旨在为角色扮演语言模型(RPLAs)的研究和应用提供高质量的原始数据。数据集涵盖了全面的角色描述、对话、场景背景、角色动机和情节概要,能够支撑角色扮演模型的训练、评估和检索。

查看CoSER

README 内容: 

 

关于 复旦大学 , 复旦大学是中国顶尖的综合性研究型大学之一,位于中国上海,是中国教育部直属的全国重点大学,也是‘双一流’建设高校之一。该校在多个学科领域都有显著的研究成果和学术贡献。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们