five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

伦敦帝国学院 发布 ScenePoint 数据集, 应用在 三维视觉、语言学习 领域

五号数据雷达开源数据市场2025-11-22 14:3617
ScenePoint 是 伦敦帝国学院 发布的数据集,于 2025-11-21 首发在 arXiv 应用于 三维视觉、语言学习 领域

伦敦帝国学院 本次发布的数据集 ScenePoint, ScenePoint是由伦敦帝国学院构建的大规模点图数据集,专为三维视觉语言学习设计。该数据集整合了ScanNet、3RScan和ARKitScenes三大真实场景数据集,包含6,562个房间级场景及100万单视图点图,通过VGGT模型将二维图像转化为三维点图结构。数据集采用多视图采样与LLM生成描述技术,构建了点图-图像-文本三元组对齐数据,主要应用于三维场景理解、视觉问答和具身导航等领域,旨在解决三维表征学习中预训练先验稀缺和数据匮乏的核心挑战。

查看ScenePoint

关于 伦敦帝国学院 , 伦敦帝国学院是一所世界顶尖的公立研究型大学,专注于科学、工程、医学和商学领域,享有极高的国际声誉。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们