five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

香港中文大学(深圳) 发布 SA-Eval 数据集, 应用在 语音识别、音频处理 领域

五号数据雷达开源数据市场2025-03-21 07:0322
SA-Eval 是 香港中文大学(深圳) 发布的数据集,于 2025-03-19 首发在 arXiv 应用于 语音识别、音频处理 领域

香港中文大学(深圳) 本次发布的数据集 SA-Eval, SA-Eval数据集是基于多个公开数据集构建的,包含音频分类、音频标注和音频问答三种任务。该数据集通过结合不同的语音指令和背景音频,模拟现实世界中的多种场景,分为容易和困难两种难度级别,以评估模型在不同条件下的性能。数据集的构建利用了GPT-4o生成多样化的指令,并通过不同的TTS模型生成相应的语音指令,再与音频信号混合,形成最终的测试集。

查看SA-Eval

README 内容: 

 

关于 香港中文大学(深圳) , 香港中文大学(深圳)是一所位于中国广东省深圳市的综合性研究型大学,是香港中文大学在深圳的校区。该校致力于培养具有国际视野和专业素养的人才,研究领域涵盖数据科学等多个学科。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们