腾讯AI实验室 本次发布的数据集 哈利波特对话(HPD)数据集, 哈利波特对话(HPD)数据集是由腾讯AI实验室和香港科技大学(广州)联合创建的双语数据集,旨在推进对话代理与故事角色对齐的研究。该数据集包含《哈利波特》系列小说中的所有对话,涵盖英语和中文版本,并附有重要的背景信息,如对话场景、说话者、角色关系和属性。HPD数据集不仅为大型语言模型提供了丰富的角色驱动对话能力,还可用作评估语言模型与特定角色对齐程度的通用基准。此外,数据集的构建过程中,特别关注了场景、属性和关系的动态变化,以更准确地反映故事情节的发展。HPD数据集的应用领域广泛,特别是在提升对话代理与故事角色的对齐度方面,展示了其重要价值。
关于 腾讯AI实验室 , 腾讯AI实验室是腾讯公司旗下的研究机构,专注于人工智能技术的研究和应用,涵盖机器学习、自然语言处理、计算机视觉等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)