亚马逊研究 本次发布的数据集 ChaI-TeA, ChaI-TeA数据集由亚马逊研究和以色列理工学院共同创建,旨在评估基于大型语言模型(LLM)的聊天机器人的自动完成功能。该数据集包含来自Open Assistant和ShareGPT的对话数据,总计536,215条前缀数据,涵盖了广泛的自然语言交互场景。数据集通过提取用户与聊天机器人的对话历史,生成前缀与上下文对,用于训练和评估自动完成模型。该数据集的应用领域主要集中在提升用户与聊天机器人交互的效率,减少用户输入的时间和认知负担,特别是在处理长文本和多主题对话时。
README 内容:
关于 亚马逊研究 , 亚马逊研究是亚马逊公司的一个部门,专注于开发新技术和创新解决方案,以支持亚马逊的电子商务、云计算、人工智能等业务领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)