Ben Gurion University of the Negev 本次发布的数据集 RGB-Depth (KITTI), RGB-Polarimetric, RGB-Infrared (M3FD), RGBX-DiffusionDet是一种多模态对象检测框架,它扩展了DiffusionDet模型,以融合异构2D数据(X)与RGB图像。为了实现跨模态交互,设计了一种在卷积块注意力模块(DCR-CBAM)中的动态通道减少,这通过动态突出显著的通道特征来促进子网络之间的交叉对话。此外,提出了动态多级聚合块(DMLAB),以通过自适应多尺度融合来细化空间特征表示。最后,引入了新的正则化损失,以强制执行通道显著性和空间选择性,从而产生紧凑且具有区分度的特征嵌入。该框架在RGB-Depth (KITTI)、RGB-Polarimetric和RGB-Infrared (M3FD)数据集上进行了广泛实验,证明了该方法相对于基线RGB-only DiffusionDet的一致性优势。RGBX-DiffusionDet作为一个灵活的多模态对象检测方法,为将不同的2D传感模式集成到基于扩散的检测流程中提供了新的见解。
查看RGB-Depth (KITTI), RGB-Polarimetric, RGB-Infrared (M3FD)
关于 Ben Gurion University of the Negev , 本古里安大学是以色列的一所公立研究型大学,位于内盖夫沙漠的贝尔谢瓦市,以其在沙漠农业、工程学和健康科学等领域的卓越研究而闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)