five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

亚马逊研究 发布 ChaI-TeA 数据集, 应用在 聊天机器人、自动完成 领域

五号数据雷达开源数据市场2024-12-26 08:1617
ChaI-TeA 是 亚马逊研究 发布的数据集,于 2024-12-24 首发在 arXiv 应用于 聊天机器人、自动完成 领域

亚马逊研究 本次发布的数据集 ChaI-TeA, ChaI-TeA数据集由亚马逊研究和以色列理工学院共同创建,旨在评估基于大型语言模型(LLM)的聊天机器人的自动完成功能。该数据集包含来自Open Assistant和ShareGPT的对话数据,总计536,215条前缀数据,涵盖了广泛的自然语言交互场景。数据集通过提取用户与聊天机器人的对话历史,生成前缀与上下文对,用于训练和评估自动完成模型。该数据集的应用领域主要集中在提升用户与聊天机器人交互的效率,减少用户输入的时间和认知负担,特别是在处理长文本和多主题对话时。

查看ChaI-TeA

README 内容: 

 

关于 亚马逊研究 , 亚马逊研究是亚马逊公司的一个部门,专注于开发新技术和创新解决方案,以支持亚马逊的电子商务、云计算、人工智能等业务领域。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们