CN117351360A

CN117351360A - 一种基于注意力机制改进的遥感图像道路提取方法

Info

Publication number: CN117351360A
Application number: CN202311407525.2A
Authority: CN
Inventors: 魏德宾; 李品儒; 解鸿基; 徐永强; 王欣睿; 温京龙
Original assignee: Dalian University
Current assignee: Dalian University
Priority date: 2023-10-27
Filing date: 2023-10-27
Publication date: 2024-01-05

Abstract

本发明公开了一种基于注意力机制改进的遥感图像道路提取方法，包括以下步骤：制备数据集；搭建遥感图像道路提取网络；训练遥感图像道路提取网络。本发明采用预训练的DenseNet‑121作为遥感图像道路提取网络的编码器，充分利用了在大规模图像数据集上预训练的权重，从而使道路提取网络能够更好地理解和捕捉道路图像中的关键特征，大大提高了道路提取网络在道路提取任务中的性能和准确性，为相关领域的研究和应用提供了可靠的技术基础。本发明在道路提取网络中引入了循环交叉注意力模块和卷积注意力模块，能够更好地理解道路的整体结构和特征，从而提高了道路提取的准确性和鲁棒性，显著提高了网络的表达能力和对图像局部信息的关注度。

Description

一种基于注意力机制改进的遥感图像道路提取方法

技术领域

本发明涉及到遥感图像分割与深度学习技术领域，具体是一种基于注意力机制改进的高分辨率遥感图像道路提取方法。

背景技术

随着遥感技术的不断发展，越来越多的高分辨率遥感图像可以被获取。遥感图像已经被广泛应用于环境监测、自然资源管理、城市规划、地理信息系统等诸多领域。其中，从高分辨率遥感图像中提取道路信息对于地理信息系统的制图和更新至关重要。尽管道路提取在遥感图像处理领域引起了相当多的关注，但由于高分辨率遥感图像中道路的各种复杂性，至今还没有令人满意的自动化解决方案，道路提取仍然是一项非常具有挑战性的任务。

高分辨率遥感图像中的道路特征主要包括几何特征、光谱特征、拓扑特征以及纹理特征。根据这些特征，目前已有许多道路提取方法被提出，这些方法可分为传统道路提取方法和基于深度学习的道路提取方法两大类。传统的道路提取方法是基于经验的提取方法，主要利用了图像的浅层特征，如灰度、边缘、纹理和几何形状等。基于深度学习的方法主要采用深度卷积神经网络从原始图像中隐式地提取深层抽象特征，并利用这些特征自动地提取道路信息。

目前，基于深度学习的方法大多使用深度残差网络作为骨干网进行特征提取，同时空洞卷积多被用于增大神经网络的感受野并增强神经网络获得多尺度上下文信息的能力。此外，上采样操作往往与跳跃连接相结合，以帮助网络捕获更多低层次和高层次的特征信息。虽然这些方法在道路提取任务中表现较好，但仍然存在以下不足：(1)在对原始图像进行下采样的过程中容易丢失道路特征。(2)目前的神经网络模型在遥感图像中往往无法捕获远程依赖关系，导致提取精度在很大程度上受限。(3)跳跃连接操作将来自解码器的深层次语义特征与来自编码器的浅层语义特征融合起来，虽然加强了对浅层信息的利用，但这种直接复制的方式忽视了蕴含的道路信息在空间和通道维度上的分布情况，限制了模型的分割能力。

发明内容

为了解决现有的遥感图像道路提取方法存在的问题，本发明要提出一种基于注意力机制改进的遥感图像道路提取方法，实现对道路信息更加准确的定位和提取。

为了达到上述发明目的，本发明采用如下技术方案：一种基于注意力机制改进的遥感图像道路提取方法，包括以下步骤：

A、制备数据集

收集遥感卫星拍摄的遥感图像数据，并按照以下步骤制备遥感图像道路提取数据集：

A1、对图像进行标注和裁剪

从遥感图像数据集官网下载原始遥感图像数据集，所述原始遥感图像数据集为RGB三波段彩色遥感图像数据集，并使用数据集标注软件进行标注。然后，将原始遥感图像和人工标注的标签图以相同的方式统一裁剪为1024×1024像素大小的小图片，获得不少于6000张带标签的1024×1024像素大小的遥感图像数据集，简称带标签遥感图像数据集。

A2、图像增强

经过标注和裁剪后得到的带标签遥感图像在被输入到遥感图像道路提取网络之前，采用水平翻转、垂直翻转、对角翻转、颜色抖动和平移操作进行图像增强，并将增强后的带标签遥感图像数据集简称为增强遥感图像数据集。

B、搭建遥感图像道路提取网络

所述遥感图像道路提取网络是由注意力机制改进的遥感图像道路提取网络，整体架构采用编码器-解码器架构，所述编码器包括5个编码块、依次为编码块1到编码块5，所述解码器包括4个解码块、依次为解码块1到解码块4；增强遥感图像经过编码块1和编码块2后分别输入编码块3和卷积注意力模块1，编码块3输出的特征图分别输入编码块4和卷积注意力模块2，编码块4输出的特征图分别输入编码块5和卷积注意力模块3，编码块5输出的特征图输入到循环交叉注意力模块；经过循环交叉注意力模块输出的特征图与来自卷积注意力模块3输出的特征图进行特征融合后输入到解码块4，解码块4输出的特征图与来自卷积注意力模块2输出的特征图进行特征融合后输入到解码块3，解码块3输出的特征图与来自卷积注意力模块1输出的特征图进行特征融合后输入到解码块2，解码块2输出的特征图输入解码块1，解码块1通过上采样将特征图整合为与输入遥感图像相同大小的预测图。

所述遥感图像道路提取网络搭建方法包括以下步骤：

B1、使用DenseNet-121构建编码器

使用在ImageNet数据集上预训练的DenseNet-121作为编码器，编码器由五个编码块组成，每个编码块由多个卷积层组成。在每个编码块内部，每个卷积层的输入是前面所有层的特征图的连接。每个编码块的实现方式用公式描述为：

X_l＝H_l([X₀,X₁,...,X_l-1]) (1)

其中X_l表示l层的特征图。[X₀,X₁,...,X_l-1]表示被连接到l层的特征图，H_l(·)是一个包括批量归一化、修正线性单元激活函数和卷积操作的复合函数。

B2、在遥感图像道路提取网络的中心部分引入循环交叉注意力模块

所述循环交叉注意力模块由两个交叉注意力模块串联堆叠而成，在循环交叉注意力模块中，输入特征图F；首先通过三个并行的1×1卷积操作，分别得到特征图Q、K和V。在特征图Q的空间维度上每一个特征点u的位置上，都得到一个特征向量Q_u。同时提取在特征图K中对应特征点u所处位置的水平和垂直方向的所有通道的H+W-1个像素点的特征向量，得到集合Ω_u。然后，通过一个关联操作生成特征图D。再对特征图D进行软最大化操作，将其转换为相同大小的特征图A。

关联操作的计算公式如下：

其中，是集合Ω_u中的第i个元素对应的特征向量的转置，d_i,u∈D是特征向量Q_u和Ω_i,u之间的相关程度。

根据集合Ω_u的生成方式，在特征图V上生成集合Φ_u。然后，对特征图A和V进行聚合操作，生成具有垂直和水平方向空间上下文信息的特征图F′。

聚合操作的计算公式如下：

其中，F′_u是特征图F′在位置u处的特征向量，A_i,u是特征图A在位置u处对应的特征向量中的第i个值，Φ_i,u是集合Φ_u中第i个特征向量。

B3、在遥感图像道路提取网络的跳跃连接部分引入卷积注意力模块

卷积注意力模块由通道注意力模块和空间注意力模块两个子模块组成。通道注意力模块通过计算通道之间的内部关系并对其重要性进行排名为每个通道分配特定权重。首先，在特征图F上使用平均池化和最大池化获得特征图和/>然后，特征图/>和被输入到由多层感知机创建的权值共享网络中，以生成通道注意力特征图M_C。整个过程的计算公式为：

其中，σ表示Sigmoid函数，MLP表示多层感知机，AvgPool和MaxPool分别表示平均池化和最大池化，F表示输入的特征图，W₀和W₁分别表示多层感知机中的两组权重矩阵。

空间注意力模块在空间级别上探索特征图的内部关系。首先，沿着通道维度对输入特征图进行平均池化和最大池化，获得特征图和/>然后，通过标准的卷积操作将特征图/>和/>连接起来。最后，得到通过空间注意力机制更新的特征图M_S。整个过程的计算公式为：

在上式中，f^7×7表示卷积核大小为7×7卷积操作。

整个卷积注意力模块的计算公式为：

其中F′表示经过通道注意力操作后的输入特征图，F″是最终经过细化处理的输出特征图，表示逐像素相乘。

C、训练遥感图像道路提取网络

将通过步骤A制备好的增强遥感图像数据集输入到遥感图像道路提取网络中进行训练。训练时，使用二值交叉熵损失和骰子损失组成的复合损失函数作为最终的损失函数。初始学习率设置为2e-4，同时采用适应性矩估计优化算法自适应地调整学习率，当学习率小于5e-7时，停止训练。选择在训练集上损失值最小的道路提取网络参数，在测试集上测试遥感图像道路提取网络的道路提取性能。

与现有技术相比，本发明具有以下有益效果：

1、本发明采用了预训练的DenseNet-121作为遥感图像道路提取网络的编码器，不仅具有密集连接和特征重用的优势，还充分利用了在大规模图像数据集上预训练的权重，从而使道路提取网络能够更好地理解和捕捉道路图像中的关键特征。这一选择大大提高了道路提取网络在道路提取任务中的性能和准确性，为相关领域的研究和应用提供了可靠的技术基础。

2、本发明在道路提取网络中引入了循环交叉注意力模块和卷积注意力模块。循环交叉注意力模块的引入赋予了神经网络在处理道路图像时更强的能力，特别是在捕获长程依赖关系和更有效地利用上下文信息方面。这意味着神经网络能够更好地理解道路的整体结构和特征，从而提高了道路提取的准确性和鲁棒性。卷积注意力模块在不增加过多模型参数和计算复杂度的情况下，显著提高了网络的表达能力和对图像局部信息的关注度。这一模块有助于道路提取网络更精确地关注图像中道路的关键特征，进一步提升道路提取性能。这种结合循环交叉注意力模块和卷积注意力模块的设计策略有效地将全局和局部信息融合在一起，使得道路提取网络能够更全面地理解遥感图像，更准确地识别和提取道路信息。

3、本发明在结构更简单和计算成本更少的情况下，实现了对道路区域的高精度提取，在保证能够完成道路图像分割的同时，对其细节部分进行优化，使其在工作过程中能够更多的保留道路图片的特征，避免了特征损失难以解码的问题。本发明实现了高精度和高鲁棒性的道路信息提取。

4、综上所述，本发明基于注意力机制改进的遥感图像道路提取方法具有广阔的应用前景。

附图说明

图1是本发明的架构图。

图2是一个五层的密集块结构图。

图3是交叉注意力模块结构图。

图4是卷积注意力模块的结构图。

图5是本发明与其他道路分割网络的道路提取效果对比图。

具体实施方式

下面结合附图对本发明进行进一步说明。如图1所示，一种基于注意力机制改进的遥感图像道路提取方法，具体步骤如下：

Step1:收集遥感卫星拍摄的遥感图像数据。从遥感图像数据集官网下载原始遥感图像数据集，所述原始遥感图像数据集为RGB三波段彩色遥感图像数据集。

Step2:遥感图像数据集标注。使用遥感图像标注工具对采集自遥感卫星的RGB三通道彩色遥感图像中的道路区域进行标注，得到与原图大小相同的标签图。标签图为黑白二值图，其中道路标记为黑色，背景为白色。

Step3:图像裁剪。将原始的RGB彩色遥感图像和其对应的标签图采用相同的方式裁剪为1024×1024像素大小的小图，得到6226张带标签的1024×1024像素大小的遥感图像数据集。

Step4:图像增强。采用水平翻转、垂直翻转、对角翻转、颜色抖动和平移等操作对裁剪后得到的6226张1024×1024像素大小的遥感图像进行图像增强。

Step5:数据集划分。将经过图像增强后的6226张带标签的遥感图像按4:1的比例随机划分为训练集和测试集，得到4981张训练图像和1245张测试图像。

Step6:搭建遥感图像道路提取网络。遥感图像道路提取网络整体架构采用编码器-解码器架构，所述编码器包括5个编码块、依次为编码块1到编码块5，所述解码器包括4个解码块、依次为解码块1到解码块4；经图像增强后的1024×1024像素大小的遥感图像经过编码块1和编码块2后分别输入编码块3和卷积注意力模块1，编码块3输出的特征图分别输入编码块4和卷积注意力模块2，编码块4输出的特征图分别输入编码块5和卷积注意力模块3，编码块5输出的特征图输入到循环交叉注意力模块；经过循环交叉注意力模块输出的特征图与来自卷积注意力模块3输出的特征图进行特征融合后输入到解码块4，解码块4输出的特征图与来自卷积注意力模块2输出的特征图进行特征融合后输入到解码块3，解码块3输出的特征图与来自卷积注意力模块1输出的特征图进行特征融合后输入到解码块2，解码块2输出的特征图输入解码块1，解码块1通过上采样将特征图整合为与输入遥感图像相同大小的预测图。

Step7:训练遥感图像道路提取网络。将经过Step5划分后得到的4981张训练图像输入到遥感图像道路提取网络中，在两台NVIDIA GeForce RTX 3090显卡上同时进行训练，每次训练处理的图片数量设置为8张。训练时，使用二值交叉熵损失和骰子损失组成的复合损失函数最为最终的损失函数。初始学习率设置为2e-4，同时同时采用适应性矩估计优化算法自适应地调整学习率，当学习率小于5e-7时，停止训练。选择在训练集上损失值最小的道路提取网络参数，在测试集上测试遥感图像道路提取网络的道路提取性能。

Step8:对遥感图像道路提取网络进行性能测试。将经过Step5划分后得到的1245张测试图像输入到训练好的遥感图像道路提取网络，输出对应的1245张预测图。

Step9:基于遥感图像道路提取网络预测结果评估。采用F1分数和交并比等评估指标对预测结果进行评估，同时结合预测结果的视觉对比图进行综合评估。如图5所示，一些主流的道路提取网络在已经表现出较好的道路提取效果，即使是结构相对简单的U-Net网络也能提取较为完整的道路信息。然而，这些主流的方法对于小尺寸道路和一些复杂场景下的道路并没有表现出较好的检测性能，其主要原因是没有对图像的全局信息和局部信息进行有效融合且缺乏对图像上下文信息的理解。图5中第1、2行展示了不同的道路提取网络在小尺寸道路和背景信息比较复杂的道路上的道路提取效果，可以明显看出，相比于其他方法，遥感图像道路提取网络能够有效提取被遮挡的小尺寸道路。图5第3、4行展示了不同的道路提取网络在背景较为复杂的城市场景下对道路的检测效果，很明显本发明的遥感图像道路提取网络表现出更高的道路检测率以及更低的误判率。图5第5行展示了不同的道路提取网络在农村场景下的道路检测效果，可以看到，一些经典的道路提取网络无法对农田之间的土路和主要道路做出较好的区分，而遥感图像道路提取网络对于土路也具有很好的抗干扰能力。此外，对于图5第6行展示的形状复杂和轮廓不规则的道路，基于注意力机制改进的道路提取网络同样提供了更加完整的道路提取结果。

本发明不局限于本实施例，任何在本发明披露的技术范围内的等同构思或者改变，均列为本发明的保护范围。

Claims

1.一种基于注意力机制改进的遥感图像道路提取方法，其特征在于：包括以下步骤：

A、制备数据集

收集遥感卫星拍摄的遥感图像数据，并制备遥感图像道路提取数据集：

B、搭建遥感图像道路提取网络

所述遥感图像道路提取网络是由注意力机制改进的遥感图像道路提取网络，整体架构采用编码器-解码器架构；

C、训练遥感图像道路提取网络

将通过步骤A制备好的增强遥感图像数据集输入到遥感图像道路提取网络中进行训练；选择在训练集上损失值最小的道路提取网络参数，在测试集上测试遥感图像道路提取网络的道路提取性能。

2.根据权利要求1所述一种基于注意力机制改进的遥感图像道路提取方法，其特征在于：步骤A所述制备数据集的方法包括以下步骤：

A1、对图像进行标注和裁剪

从遥感图像数据集官网下载原始遥感图像数据集，所述原始遥感图像数据集为RGB三波段彩色遥感图像数据集，并使用数据集标注软件进行标注；然后，将原始遥感图像和人工标注的标签图以相同的方式统一裁剪为1024×1024像素大小的小图片，获得不少于6000张带标签的1024×1024像素大小的遥感图像数据集，简称带标签遥感图像数据集；

A2、图像增强

3.根据权利要求1所述一种基于注意力机制改进的遥感图像道路提取方法，其特征在于：步骤B所述编码器包括5个编码块、依次为编码块1到编码块5，所述解码器包括4个解码块、依次为解码块1到解码块4；增强遥感图像经过编码块1和编码块2后分别输入编码块3和卷积注意力模块1，编码块3输出的特征图分别输入编码块4和卷积注意力模块2，编码块4输出的特征图分别输入编码块5和卷积注意力模块3，编码块5输出的特征图输入到循环交叉注意力模块；经过循环交叉注意力模块输出的特征图与来自卷积注意力模块3输出的特征图进行特征融合后输入到解码块4，解码块4输出的特征图与来自卷积注意力模块2输出的特征图进行特征融合后输入到解码块3，解码块3输出的特征图与来自卷积注意力模块1输出的特征图进行特征融合后输入到解码块2，解码块2输出的特征图输入解码块1，解码块1通过上采样将特征图整合为与输入遥感图像相同大小的预测图。

4.根据权利要求1所述一种基于注意力机制改进的遥感图像道路提取方法，其特征在于：步骤B所述遥感图像道路提取网络搭建方法包括以下步骤：

B1、使用DenseNet-121构建编码器

使用在ImageNet数据集上预训练的DenseNet-121作为编码器，编码器由五个编码块组成，每个编码块由多个卷积层组成；在每个编码块内部，每个卷积层的输入是前面所有层的特征图的连接；每个编码块的实现方式用公式描述为：

X_l＝H_l([X₀,X₁,...,X_l-1]) (1)

其中X_l表示l层的特征图；[X₀,X₁,...,X_l-1]表示被连接到l层的特征图，H_l(·)是一个包括批量归一化、修正线性单元激活函数和卷积操作的复合函数；

所述循环交叉注意力模块由两个交叉注意力模块串联堆叠而成，在循环交叉注意力模块中，输入特征图F；首先通过三个并行的1×1卷积操作，分别得到特征图Q、K和V；在特征图Q的空间维度上每一个特征点u的位置上，都得到一个特征向量Q_u；同时提取在特征图K中对应特征点u所处位置的水平和垂直方向的所有通道的H+W-1个像素点的特征向量，得到集合Ω_u；然后，通过一个关联操作生成特征图D；再对特征图D进行软最大化操作，将其转换为相同大小的特征图A；

关联操作的计算公式如下：

其中，是集合Ω_u中的第i个元素对应的特征向量的转置，d_i,u∈D是特征向量Q_u和Ω_i,u之间的相关程度；

根据集合Ω_u的生成方式，在特征图V上生成集合Φ_u；然后，对特征图A和V进行聚合操作，生成具有垂直和水平方向空间上下文信息的特征图F′；

聚合操作的计算公式如下：

其中，F′_u是特征图F′在位置u处的特征向量，A_i,u是特征图A在位置u处对应的特征向量中的第i个值，Φ_i,u是集合Φ_u中第i个特征向量；

卷积注意力模块由通道注意力模块和空间注意力模块两个子模块组成；通道注意力模块通过计算通道之间的内部关系并对其重要性进行排名为每个通道分配特定权重；首先，在特征图F上使用平均池化和最大池化获得特征图和/>然后，特征图/>和/>被输入到由多层感知机创建的权值共享网络中，以生成通道注意力特征图M_C；整个过程的计算公式为：

其中，σ表示Sigmoid函数，MLP表示多层感知机，AvgPool和MaxPool分别表示平均池化和最大池化，F表示输入的特征图，W₀和W₁分别表示多层感知机中的两组权重矩阵；

空间注意力模块在空间级别上探索特征图的内部关系；首先，沿着通道维度对输入特征图进行平均池化和最大池化，获得特征图和/>然后，通过标准的卷积操作将特征图/>和/>连接起来；最后，得到通过空间注意力机制更新的特征图M_S；整个过程的计算公式为：

在上式中，f^7×7表示卷积核大小为7×7卷积操作；

整个卷积注意力模块的计算公式为：

5.根据权利要求1所述一种基于注意力机制改进的遥感图像道路提取方法，其特征在于：步骤C所述训练遥感图像道路提取网络的方法，使用二值交叉熵损失和骰子损失组成的复合损失函数作为最终的损失函数；初始学习率设置为2e-4，同时采用适应性矩估计优化算法自适应地调整学习率，当学习率小于5e-7时，停止训练。