复旦大学 本次发布的数据集 CoSER, CoSER数据集包含来自771部著名文学作品的17,966个角色的真实对话和丰富多样的数据类型,如对话场景、角色经验、内心思想等。该数据集通过LLM处理书籍内容而创建,旨在为角色扮演语言模型(RPLAs)的研究和应用提供高质量的原始数据。数据集涵盖了全面的角色描述、对话、场景背景、角色动机和情节概要,能够支撑角色扮演模型的训练、评估和检索。
README 内容:
关于 复旦大学 , 复旦大学是中国顶尖的综合性研究型大学之一,位于中国上海,是中国教育部直属的全国重点大学,也是‘双一流’建设高校之一。该校在多个学科领域都有显著的研究成果和学术贡献。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)