纽约大学 本次发布的数据集 RoofNet, RoofNet是一个多模态数据集,旨在进行屋顶材料分类。它包含了来自全球184个不同地理位点的超过51,500个样本,这些样本结合了高分辨率的地球观测(EO)图像和精心策划的文本注释。RoofNet包括14种关键的屋顶类型,如沥青瓦、粘土瓦和金属板。该数据集旨在通过视觉-语言建模(VLM)来提高全球暴露数据集的保真度。RoofNet通过将EO瓦片从气候和建筑风格不同的地区进行采样来构建一个具有代表性的数据集。一个子集的6,000张图像与领域专家合作进行了注释,以微调VLM。RoofNet还提供了丰富的元数据,包括屋顶形状、占地面积、太阳能电池板的的存在以及混合屋顶材料的指标。RoofNet支持可扩展的、人工智能驱动的风险评估,并作为评估模型在不同地区泛化能力的下游基准,为保险承保、灾害预防和基础设施政策规划提供有意义的见解。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)