清华大学本次发布的数据集ImViD,ImViD是由清华大学等机构联合构建的多模态沉浸式体视频数据集,采用空间导向捕获策略,通过定制化移动采集设备同步获取多视角视频与音频。该数据集包含复杂室内外场景的5K分辨率60FPS动态内容(单段1-5分钟),涵盖360度前景-背景交互与挑战性运动模式,在空间覆盖度、时间连续性和多模态丰富性上超越现有基准。数据采集过程结合静态密集采样与动态长时记录,通过高斯时空表征框架支持动态光场重建与声场合成,主要应用于VR/AR领域的沉浸式媒体生产,旨在解决真实场景高自由度交互与多模态同步重建的难题。
关于清华大学,清华大学是中国著名高等学府,坐落于北京,始建于1911年,是中国顶尖的综合性研究型大学之一,以工程、计算机科学、经济管理等学科著称。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)