马里兰大学帕克分校本次发布的数据集SONOSCENE360,SONOSCENE360是由马里兰大学帕克分校团队构建的创新型音频-视觉场景数据集,包含68条经过严格校准的360°全景视频与Ambisonic空间音频配对数据,覆盖喷泉、厨房等六类真实场景。该数据集通过专业设备(Insta360 X5相机和RØDE NT-SF1麦克风)采集,标注了声源的语义标签、方向描述及空间坐标,为3D音频-视觉联合生成任务提供基准评估。其核心价值在于首次实现了视觉场景几何结构与空间声场的精准对齐,支持自由视点探索与跨模态语义一致性研究,可应用于VR沉浸式体验、单样本声学学习等前沿领域。
关于马里兰大学帕克分校,马里兰大学帕克分校是美国马里兰州的一所公立研究型大学,成立于1856年,是马里兰大学系统的旗舰校。该校在科学、工程、人文和社会科学等多个领域具有卓越的研究和教学水平,是美国顶尖的公立大学之一。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)