PolyAI Limited 本次发布的数据集 EVI, EVI数据集是由位于英国伦敦的PolyAI Limited创建的多语言口语对话任务数据集,包含5,506个对话,涵盖英语、波兰语和法语。该数据集专注于基于知识的注册、验证和识别任务,旨在支持个性化和隐私导向的服务,通过口语对话系统进行用户身份的注册、验证和识别。数据集的创建过程涉及使用faker工具随机生成本地依赖的配置文件,并利用Google的特定语言语音识别和文本转语音技术。该数据集的应用领域包括自动化呼叫中心,以提高对话系统的安全性和用户体验。
README 内容:
关于 PolyAI Limited , PolyAI Limited是一家专注于人工智能技术研究和应用的公司,尤其在语音识别和自然语言处理领域有深入的研究和产品开发。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)