Chai Research 本次发布的数据集 Chai User Response Dataset, 该数据集包含了5000万个以聊天机器人回应结束的局部对话,标注信息包括对话轮次、后续用户消息数量、是否请求重新生成以及用户的星级评价。此外,每个完整的对话在数据集中多次出现,每次代表聊天机器人的一个轮次。该数据集的公开发布旨在促进对构建引人入胜的聊天机器人的进一步研究。规模上,数据集包含了5000万个部分对话,其任务旨在训练一个奖励模型,以提升聊天机器人的互动性和回应质量。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)