清华大学本次发布的数据集dense scene-description dataset,该数据集由清华大学与腾讯混元联合构建,包含密集的3D空间描述信息,旨在为模型提供结构化全局空间信号。数据内容覆盖场景上下文、物体数量及空间关系,通过视频流中的几何对应性和时间连续性监督模型权重更新。其构建过程结合了长时序视频分析与空间预测机制,应用于增强多模态大模型的流式空间理解能力,解决机器人导航、自动驾驶等场景中的长视野空间推理问题。
查看dense scene-description dataset
关于清华大学,清华大学是中国北京市的一所顶尖综合性研究型大学,成立于1911年,以工程、计算机科学、经济管理等学科著称,是中国最著名的高等学府之一。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)