首页 / 开源数据市场 / 正文

清华大学发布ImViD数据集,应用在沉浸式媒体、多模态数据领域

五号数据雷达开源数据市场2026-04-14 05:3338

ImViD是清华大学发布的数据集,于2026-04-11首发在arXiv应用于沉浸式媒体、多模态数据领域

清华大学本次发布的数据集ImViD,ImViD是由清华大学等机构联合构建的多模态沉浸式体视频数据集，采用空间导向捕获策略，通过定制化移动采集设备同步获取多视角视频与音频。该数据集包含复杂室内外场景的5K分辨率60FPS动态内容（单段1-5分钟），涵盖360度前景-背景交互与挑战性运动模式，在空间覆盖度、时间连续性和多模态丰富性上超越现有基准。数据采集过程结合静态密集采样与动态长时记录，通过高斯时空表征框架支持动态光场重建与声场合成，主要应用于VR/AR领域的沉浸式媒体生产，旨在解决真实场景高自由度交互与多模态同步重建的难题。

查看ImViD

关于清华大学,清华大学是中国著名高等学府，坐落于北京，始建于1911年，是中国顶尖的综合性研究型大学之一，以工程、计算机科学、经济管理等学科著称。

关于arXiv,全球最大的预印本学术论文数据库，涵盖物理、数学、计算机科学等多个学科领域。

社区讨论

近期热门