Research team 本次发布的数据集 IoT Speech Command Dataset, 该数据集是由Arduino Nano 33 BLE Sense微控制器板载麦克风收集的,时长超过一小时的音频数据组成,专为涉及23个不同关键词的语音识别任务而设计。每个关键词大约包含一分三十秒的录音数据,这些数据被划分为训练集(占80%)和测试集(占20%)。此外,数据集还包含了用于背景噪声的一般噪声数据。该任务的目的是进行语音识别。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)