five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北航发布全球覆盖大规模多模态遥感数据集EarthMM 破解遥感AI训练数据供给瓶颈

五号数据雷达开源数据市场2026-05-21 05:3011
2026年5月20日,北京航空航天大学研究团队在arXiv平台首发大规模多模态遥感影像数据集EarthMM,该数据集覆盖280万张全球多分辨率多模态影像,可支撑多模态遥感图像生成、跨模态遥感分析等核心研究方向,为遥感AI技术落地提供重要数据基础。

随着AI大模型技术向空间信息领域加速渗透,多模态遥感技术已成为自然资源监测、应急救灾、智慧城市建设等场景的核心支撑技术,但行业长期面临多模态遥感数据获取门槛高、模态间对齐精度不足、标注训练数据稀缺等痛点,严重制约了遥感AI模型的研发与商业化落地。在此背景下,北京航空航天大学研究团队正式发布大规模多模态遥感影像数据集EarthMM,为统一多模态生成模型的研发提供核心数据底座。
据介绍,EarthMM是当前全球覆盖范围较广的公开多模态遥感影像数据集之一,共包含280万张全球分布的多分辨率图像,涵盖RGB、SAR、NIR、全色和OSM五种常用遥感模态,同步提供220万组经过严格校准的对齐图像对,空间分辨率覆盖0.5至10米每像素,可满足不同精度的遥感算法训练需求。为保障数据质量,数据集构建过程中整合了全球范围内的多源公开遥感观测资源,通过严格的几何校正、辐射校正流程消除不同模态、不同传感器的观测误差,确保模态间的空间与信息对齐精度。
从应用方向来看,该数据集主要面向多模态遥感图像的生成与翻译研究,可支撑多模态联合分布建模、跨模态互补分析以及下游任务的生成式数据增强等核心研发工作,有望解决此前多模态观测数据稀缺与数据异构性带来的模型训练难题。基于该数据集的研究成果可落地至多个民用场景:例如在灾害应急场景中,可通过SAR与光学影像的跨模态生成技术,实现云层遮挡、夜间等极端条件下的地表清晰成像,为灾情快速研判提供支撑;在自然资源监测场景中,多模态数据互补可提升植被覆盖变化、违建识别、耕地保护等任务的识别精度;在智慧城市建设中,融合多模态遥感数据可实现城市建设用地、公共服务资源分布的动态监测,为城市规划提供数据参考。作为国内高校开放的高价值垂直领域数据集,EarthMM的发布也将为我国空间信息数据要素的流通应用、遥感产业的数字化转型提供重要参考。
查看EarthMM

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们