本次发布的数据集 Multimodal-WCE-1 (MM-WCE-1) and Multimodal-WCE-2 (MM-WCE-2), 该数据集在先进的渲染技术支持下,于虚拟胶囊内窥镜环境中收集而成。它包含了来自单目无线胶囊内窥镜的振动信号和视觉数据,并附有标注的振动强度、真实深度图以及自运动数据。该数据集旨在通过多模态学习减轻振动噪声,并在真实场景中验证了其卓越的泛化能力。数据集规模涵盖多个视频序列,分别用于训练、验证和测试。其任务旨在进行深度估计和自运动估计。
查看Multimodal-WCE-1 (MM-WCE-1) and Multimodal-WCE-2 (MM-WCE-2)
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)