NTT Corporation 本次发布的数据集 DCASE2025 Task 4 Dataset, DCASE2025 Task 4 数据集是为DCASE 2025挑战赛中的空间语义分割声音场景(S5)任务而创建的,旨在从多通道空间输入信号中检测和分离声音事件。该数据集包括孤立的声音事件、房间脉冲响应、环境噪声和干扰声音,所有这些数据都是为新任务而重新录制的。它用于训练和评估沉浸式通信技术系统,包括扩展现实(XR)。数据集共包含18个类别的声音事件,每个音频片段长度固定为10秒,包含1到3个同时发生的声音事件。数据集的开发集包含训练、验证和测试三个子集,而评估集则是全新录制的,不包含任何公开可用的数据。
关于 NTT Corporation , NTT Corporation(日本电信电话株式会社)是一家日本的电信公司,提供固定电话、移动电话、互联网和信息服务。它是世界上最大的电信公司之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)