首页 / 开源数据市场 / 正文

亚马逊研究发布 ChaI-TeA 数据集, 应用在聊天机器人、自动完成领域

五号数据雷达开源数据市场2024-12-26 08:1617

ChaI-TeA 是亚马逊研究发布的数据集,于 2024-12-24 首发在 arXiv 应用于聊天机器人、自动完成领域

亚马逊研究本次发布的数据集 ChaI-TeA, ChaI-TeA数据集由亚马逊研究和以色列理工学院共同创建，旨在评估基于大型语言模型（LLM）的聊天机器人的自动完成功能。该数据集包含来自Open Assistant和ShareGPT的对话数据，总计536,215条前缀数据，涵盖了广泛的自然语言交互场景。数据集通过提取用户与聊天机器人的对话历史，生成前缀与上下文对，用于训练和评估自动完成模型。该数据集的应用领域主要集中在提升用户与聊天机器人交互的效率，减少用户输入的时间和认知负担，特别是在处理长文本和多主题对话时。

查看ChaI-TeA

README 内容：

关于亚马逊研究 , 亚马逊研究是亚马逊公司的一个部门，专注于开发新技术和创新解决方案，以支持亚马逊的电子商务、云计算、人工智能等业务领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

亚马逊研究 发布 ChaI-TeA 数据集, 应用在 聊天机器人、自动完成 领域

README 内容：

社区讨论

亚马逊研究发布 ChaI-TeA 数据集, 应用在聊天机器人、自动完成领域