针对目前现有单应性估计方法存在的精度不高、对大基线场景与运动模糊场景适应性不强的问题,构建了一种带有注意力机制的大基线场景端到端单应性估计方法,采用无监督学习的方式进行单应性估计。首先,引入SE通道注意力模块,构建带有注意力机制的单应性回归网络层,获得网络对于图像各通道间关联性的学习;其次,构建基于掩膜与感知损失度量的二元无监督损失方式,提高网络感知域范围以及网络对于大基线场景的适应性;最后,构建Homo-COCO合成数据集,采用数据增强使得网络模型对于光照变化与运动模糊具有一定的鲁棒性,获得更强的真实场景泛化能力。经过充分的对比及消融实验表明,本文方法在精度指标与场景适应性方面优于现有方法,具有良好的准确性与适应性。本方法可以有效估计图像单应性,为图像拼接、图像校正等计算机视觉后续任务提供准确参数估计。
林佐江,曹 旭,陈 玮,白 宇,米 博,张学伟,方 浩.一种带有注意力机制的大基线场景端到端单应性估计方法[J].河北科技大学学报,,():