首页 / 开源数据市场 / 正文

伦敦帝国学院发布 ScenePoint 数据集, 应用在三维视觉、语言学习领域

五号数据雷达开源数据市场2025-11-22 14:3617

ScenePoint 是伦敦帝国学院发布的数据集,于 2025-11-21 首发在 arXiv 应用于三维视觉、语言学习领域

伦敦帝国学院本次发布的数据集 ScenePoint, ScenePoint是由伦敦帝国学院构建的大规模点图数据集，专为三维视觉语言学习设计。该数据集整合了ScanNet、3RScan和ARKitScenes三大真实场景数据集，包含6,562个房间级场景及100万单视图点图，通过VGGT模型将二维图像转化为三维点图结构。数据集采用多视图采样与LLM生成描述技术，构建了点图-图像-文本三元组对齐数据，主要应用于三维场景理解、视觉问答和具身导航等领域，旨在解决三维表征学习中预训练先验稀缺和数据匮乏的核心挑战。

查看ScenePoint

关于伦敦帝国学院 , 伦敦帝国学院是一所世界顶尖的公立研究型大学，专注于科学、工程、医学和商学领域，享有极高的国际声誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库，涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

社区讨论

近期热门

伦敦帝国学院 发布 ScenePoint 数据集, 应用在 三维视觉、语言学习 领域

社区讨论

伦敦帝国学院发布 ScenePoint 数据集, 应用在三维视觉、语言学习领域