CN113744185A

CN113744185A - 一种基于深度学习和图像处理的混凝土表观裂缝分割方法

Info

Publication number: CN113744185A
Application number: CN202110854998.1A
Authority: CN
Inventors: 戴姣; 吕艳洁; 吴刚; 侯士通; 陈金桥; 王浩琛
Original assignee: Jiangsu Dongyin Intelligent Engineering Technology Research Institute Co ltd; Southeast University
Current assignee: Jiangsu Dongyin Intelligent Engineering Technology Research Institute Co ltd; Southeast University
Priority date: 2021-07-28
Filing date: 2021-07-28
Publication date: 2021-12-03

Abstract

本发明公开了一种基于深度学习和图像处理的混凝土表观裂缝分割方法，包括如下步骤：获取混凝土表观带有裂缝的数字图像，对裂缝进行标注，对标注结果处理后得到裂缝掩码图；将掩码后的混凝土表观数字图像划分成训练集和验证集，然后切割成子图；构建表观裂粗分割模型，利用训练集对模型进行训练；将待检测混凝土表观数字图像切割成子图，输入到粗分割模型；对待检测原图和裂缝粗分割结果图进行插值，得到细化分割结果图；求取细化分割结果图的轮廓。本发明利用u2net分割模型完成混凝土表观裂缝的粗分割，对于微小裂缝，整图切割结合结果融合策略、组合损失以及通过像素聚类对粗分割结果细化，对微小裂缝具有较好的检测效果。

Description

一种基于深度学习和图像处理的混凝土表观裂缝分割方法

技术领域

本发明涉及混凝土表观裂缝检测领域，特别涉及一种基于深度学习和图像处理的混凝土表观裂缝分割方法。

背景技术

混凝土结构是我国建筑领域中采用范围最广的建筑结构形式之一，而桥梁是交通基础设施的重要组成部分，对于混凝土桥梁而言，裂缝是最重要的病害之一。大多数桥梁都是带裂缝工作的，但是裂缝的出现会影响桥梁的安全性、耐久性，且当裂缝宽度值达到最大限值时，桥梁结构会遭到破坏，因此精准的掌握桥梁裂缝的形态、长度、宽度等特征信息对于判断评估桥梁的工作状态和安全状态具有重要意义，也可为后续的修复及加固工作提供指导依据。

原始的桥梁检测方法以人工目测为主，利用搭设支架、桥检车以及望远镜等辅助设备来检查混凝土桥梁表面开裂状况，此方法费时费力且准确率低、工作人员安全无法得到保障，对于一些目测死角，人工的方法无法进行识别检测。随着对于裂缝检测的安全度和精确度的要求不断提高，传统的人工方法的劣势愈加明显。近年来，随着无人机技术的进步以及高性能计算机的出现，大量基于无人机技术的桥梁检测工作开始得以研究，其核心为图像处理技术。

基于图像分析技术的混凝土结构表面裂缝宽度的确定，主要包括裂缝图像获取、图像处理分析以及裂缝宽度计算等内容，但是目前仍存在一些问题：从图像采集到分割处理全过程的系统连贯性与精准性难以得到保证，在裂缝识别过程中，由于桥梁是室外工作，使采集环境比如光照条件、加上采集工具不可避免的抖动等造成图像的模糊；且裂缝周围存在蜘蛛网、灰尘、蜂窝麻面气孔等杂质会带来干扰，降低了裂缝提取识别精度。

发明内容

发明目的：针对以上问题，本发明目的是提供一种基于深度学习和图像处理的混凝土表观裂缝分割方法，依次通过粗分割模型和细划分割实现微小裂缝的识别检测。

技术方案：本发明的一种基于深度学习和图像处理的混凝土表观裂缝分割方法，包括如下步骤：

(1)获取已有混凝土表观带有裂缝的数字图像，在数字图像上以像素为单位对裂缝进行标注，对标注结果处理后得到裂缝掩码图；

(2)将掩码后的混凝土表观数字图像划分成训练集和验证集，分别将训练集和验证集内的图像切割成子图，删除没有裂缝的子图；

(3)构建表观裂缝粗分割模型，利用训练集对粗分割模型进行训练，将验证集用于训练后的粗分割模型，保存在验证集上召回率最高时粗分割模型权重参数；

(4)将待检测混凝土表观数字图像切割成子图，将子图集合输入到步骤(3)中经过验证集后的粗分割模型，获得子图裂缝粗分割结果，将所有子图裂缝粗分割结果进行合并，得到整图的裂缝粗分割结果图；

(5)对待检测混凝土表观数字图像的原图和步骤(4)得到的裂缝粗分割结果图进行插值，得到粗分割结果的细化分割结果图；

(6)求取细化分割结果图的轮廓，将轮廓坐标除以放大倍数缩放到原始尺寸上，求得的轮廓为最终的裂缝轮廓。

进一步，所述步骤(2)中掩码为1时，表示当前子图存在裂缝，掩码为0时，表示当前子图无裂缝。

进一步，所述步骤(3)中粗分割模型为5个不同残差U型模块构成的两级嵌套U型结构；所述残差U型模块分别为RSU7、RSU6、RSU5、RSU4、RSU4F。

进一步，，所述粗分割模型包括编码结构和解码结构；

所述编码结构包括5个残差U型模块和相应的2倍降采样，编码结构包括依次顺序设置的RSU7、降采样、RSU6、降采样、RSU5、降采样、RSU4、降采样、RSU4F、降采样、RSU4F，图像输入到RSU7模块后，依次通过降采样、RSU6、降采样、RSU5、降采样、RSU4、降采样、RSU4F、降采样，最后从RSU4F模块输出；

所述解码结构包括5个残差U型结构以及相应的2倍上采样，解码结构包括依次顺序设置的上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7，编码结构RSU4F模块输出作为上采样的输入，然后依次通过RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样后，最后从RSU7模块输出；所述编码结构和解码结构之间进行跳跃连接。

进一步，所述残差U型模块RSU7、RSU6、RSU5、RSU4包括编码结构和解码结构；所述编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×n、conv3×3、conv3×3，RSU7、RSU6、RSU5、RSU4中的n分别为5、4、3、2；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×n，其中乘以n表示重复n次；

RSU4F包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3)×3、conv3×3；解码结构为依次顺序设置的(conv3×3)×3，其中乘以3表示重复3次；所述编码结构和解码结构之间进行跳跃连接所述编码结构和解码结构之间进行跳跃连接。

进一步，所述conv3×3模块包括3×3的卷积、批标准化和非线性激活组合。

进一步，在粗分割模块的解码结构中，对上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7每一模块输出的特征图通过1×1卷积预测相应特征对应类别，并上采样到原图大小，通过激活函数Sigmoid得到对应存在裂缝的概率矩阵p₁至p₆，计算过程表示为：

Sigmoid(UpSampling₃₂(Conv2D(RSU4F)))→p₆,

Sigmoid(UpSampling₁₆(Conv2D(RSU4F)))→p₅,

Sigmoid(UpSampling₈(Conv2D(RSU4)))→p₄，

Sigmoid(UpSampling₄(Conv2D(RSU5)))→p₃，

Sigmoid(UpSampling₂(Conv2D(RSU6)))→p₂，

Sigmoid(Conv2D(RSU7))→p₁，

将概率矩阵p₁至p₆通过卷积进行融合，通过激活函数Sigmoid得到融合的概率矩阵，所述融合后存在裂缝的概率矩阵p为粗分割模型的输出，计算过程为：

Sigmoid(Conv2D(Concatenate([p₁,p₂,p₃,p₄,p₅,p₆])))→p

其中UpSampling_k中的k表示上采样UpSampling系数。

进一步，步骤(3)训练过程中对图像数据进行增强操作，所述增强操作包括：左右翻转、上下翻转、分段仿射、裁剪、旋转90度、欢度变换，训练时从所述增强操作中任选一种进行；

所述训练过程中采用加权交叉熵损失以及杰卡德相似度组合损失，同时加上权重衰减，对于粗分割模型输出的每个概率矩阵，相应的损失损失函数表示为：

其中表达式等号后第一项weighted_binary_crossentropy表示加权交叉熵损失，第二项jaccard_loss表示杰卡德相似度损失，第三项

表示权重的L2范数惩罚项，m表示权重个数，λ表示惩罚系数，w_j表示相应权重；

所述训练过程中，先采用学习率预热的方式进行模型训练，训练过程为：采用一个预先设置的学习率进行训练，然后逐步增大学习率，直到达到设定的较大学习率时结束；然后，利用学习率余弦退火调整方式进行训练，训练过程为：

对学习率进行调整，直到达到所设训练轮次结束模型训练，其中，公式中lr_min表示所设第一学习率，lr_max表示所设第二学习率，第二学习率大于第一学习率，学习率为步长，T_cur表示当前所在轮次，T_all表示设定轮次。

进一步，所述步骤(5)插值过程为：

(501)首先进行三倍双线性插值，计算插值后的粗分割结果连通域，在每个连通域内提取出粗分割结果对应的前景像素集，对应的标签等于1；

(502)根据像素强度将前景像素集分为两簇，较低像素强度的簇为裂缝前景像素，另一簇为背景簇；

(503)从插值后的粗分割结果将背景簇对应的标签置0，得到最终的细化分割结果图。

进一步，步骤(4)对于重合部分，合并原则为优先保留当前子图为裂缝的预测结果。

有益效果：本发明与现有技术相比，其显著优点是：

1、本发明利用u2net分割模型完成混凝土表观裂缝的粗分割，对于微小裂缝，整图切割结合结果融合策略、组合损失以及通过像素聚类对粗分割结果细化，解决微小裂缝分割问题，对微小裂缝具有较好的检测效果，可以辅助工程人员对混凝土的健康状况监测，提高监测的质量和效率；

2、在模型训练过程加入了特定的数据增强策略，如用分段仿射模拟拍摄抖动情况，用高斯模糊模拟图像模糊问题，提高了模型的泛化性，使之受环境的影响更小。

附图说明

图1为本发明训练流程图；

图2为本发明粗分割模型的基本结构图；

图3为本发明残差U型模块RSU7、RSU6、RSU5、RSU4基本结构图；

图4为本发明残差U型模块RSU4F基本结构图；

图5为发明检测流程图。

具体实施方式

本实施例所述的一种基于深度学习和图像处理的混凝土表观裂缝分割方法，包括如下步骤：

(2)将掩码后的混凝土表观数字图像划分成训练集和验证集，其中90％作为训练集，10％作为验证集，分别将训练集和验证集内的图像切割成子图，子图大小为544x544像素，删除没有裂缝的子图，流程如图1所示。

子图掩码为1时，表示当前子图存在裂缝，掩码为0时，表示当前子图无裂缝。

粗分割模型为5个不同残差U型模块构成的两级嵌套U型结构；残差U型模块分别为RSU7、RSU6、RSU5、RSU4、RSU4F。

粗分割模型包括编码结构和解码结构：

编码结构包括5个残差U型模块和相应的2倍降采样，编码结构包括依次顺序设置的RSU7、降采样、RSU6、降采样、RSU5、降采样、RSU4、降采样、RSU4F、降采样、RSU4F，图像输入到RSU7模块后，依次通过降采样、RSU6、降采样、RSU5、降采样、RSU4、降采样、RSU4F、降采样，最后从RSU4F模块输出；

解码结构包括5个残差U型结构以及相应的2倍上采样，解码结构包括依次顺序设置的上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7，编码结构RSU4F模块输出作为上采样的输入，然后依次通过RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样后，最后从RSU7模块输出；所述编码结构和解码结构之间进行跳跃连接。

残差U型模块包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×n、conv3×3、conv3×3，RSU7、RSU6、RSU5、RSU4、RSU4F中的n分别为5、4、3、2、3；残差U型模块中的解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×n，其中乘以n表示重复n次；所述编码结构和解码结构之间进行跳跃连接。

RSU7包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×5、conv3×3、conv3×3；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×5，其中乘以5表示重复5次；所述编码结构和解码结构之间进行跳跃连接，整体结构参考图3。

RSU6包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×4、conv3×3、conv3×3；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×4，其中乘以4表示重复4次；所述编码结构和解码结构之间进行跳跃连接，整体结构参考图3。

RSU5包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×3、conv3×3、conv3×3；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×3，其中乘以3表示重复3次；所述编码结构和解码结构之间进行跳跃连接，整体结构参考图3。

RSU4包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×2、conv3×3、conv3×3；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×2，其中乘以2表示重复2次；所述编码结构和解码结构之间进行跳跃连接，整体结构参考图3。

RSU4F包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3)×3、conv3×3；解码结构为依次顺序设置的(conv3×3)×3，其中乘以3表示重复3次；所述编码结构和解码结构之间进行跳跃连接，整体结构参考图4。

conv3×3模块包括3×3的卷积、批标准化和非线性激活组合。

在粗分割模块的解码结构中，对上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7每一模块输出的特征图通过1×1卷积预测相应特征对应类别，并上采样到原图大小，通过激活函数Sigmoid得到对应存在裂缝的概率矩阵p₁至p₆，计算过程表示为：

Sigmoid(UpSampling₃₂(Conv2D(RSU4F)))→p₆,

Sigmoid(UpSampling₁₆(Conv2D(RSU4F)))→p₅,

Sigmoid(UpSampling₈(Conv2D(RSU4)))→p₄，

Sigmoid(UpSampling₄(Conv2D(RSU5)))→p₃，

Sigmoid(UpSampling₂(Conv2D(RSU6)))→p₂，

Sigmoid(Conv2D(RSU7))→p₁，

将概率矩阵p₁至p₆通过卷积进行融合，通过激活函数Sigmoid得到融合的概率矩阵，融合后存在裂缝的概率矩阵p为粗分割模型的输出，计算过程为：

Sigmoid(Conv2D(Concatenate([p₁,p₂,p₃,p₄,p₅,p₆])))→p

其中UpSampling_k中的k表示上采样UpSampling系数。

训练过程中对图像数据进行增强操作，所述增强操作包括：左右翻转、上下翻转、分段仿射、裁剪、旋转90度、欢度变换，训练时从所述增强操作中任选一种进行；

训练过程中采用加权交叉熵损失以及杰卡德相似度组合损失，同时加上权重衰减，对于粗分割模型输出的每个概率矩阵，相应的损失损失函数表示为：

训练过程中，先采用学习率预热的方式进行模型训练，训练过程为：采用一个预先设置的学习率进行训练，然后逐步增大学习率，直到达到设定的较大学习率时结束。然后，利用学习率余弦退火调整方式进行训练，训练过程为：

对学习率进行调整，直到达到所设训练轮次结束模型训练，其中，公式中lr_min表示所设第一学习率，lr_max表示所设第二学习率，第二学习率大于第一学习率，学习率为步长，T_cur表示当前所在轮次，T_all表示设定轮次。本实施例中预先设置第一学习率1*10^-6，第二学习率参考1*10^-3，根据实验数据和实验表现再对第一学习率和第二学习率进行调整。

(4)将待检测混凝土表观数字图像切割成子图，切割大小为544x544像素，将子图集合输入到步骤(3)中经过验证集后的粗分割模型，获得子图裂缝粗分割结果，将所有子图裂缝粗分割结果进行合并，得到整图的裂缝粗分割结果图；对于重合部分，合并原则为优先保留当前子图为裂缝的预测结果。

(5)对待检测混凝土表观数字图像的原图和步骤(4)得到的裂缝粗分割结果图进行插值，得到粗分割结果的细化分割结果图，流程图如图5所示。

插值过程为：

Claims

1.一种基于深度学习和图像处理的混凝土表观裂缝分割方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的混凝土表观裂缝分割方法，其特征在于，所述步骤(2)中掩码为1时，表示当前子图存在裂缝；掩码为0时，表示当前子图无裂缝。

3.根据权利要求1所述的混凝土表观裂缝分割方法，其特征在于，所述步骤(3)中粗分割模型为5个不同残差U型模块构成的两级嵌套U型结构；所述残差U型模块包括RSU7、RSU6、RSU5、RSU4、RSU4F；

所述粗分割模型包括编码结构和解码结构；

所述解码结构包括5个残差U型结构以及相应的2倍上采样，解码结构包括依次顺序设置的上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7，编码结构RSU4F模块输出作为上采样的输入，然后依次通过RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样后，最后从RSU7模块输出；所述编码结构和解码结构之间进行跳跃连接；

所述残差U型模块RSU7、RSU6、RSU5、RSU4包括编码结构和解码结构；所述编码结构为依次顺序设置conv3×3、(conv3×3+降采样)×n、conv3×3、conv3×3，RSU7、RSU6、RSU5、RSU4中的n分别为5、4、3、2；解码结构为依次顺序设置的conv3×3、(conv3×3+上采样)×n，其中乘以n表示重复n次；

RSU4F包括编码结构和解码结构：编码结构为依次顺序设置conv3×3、(conv3×3)×3、conv3×3；解码结构为依次顺序设置的(conv3×3)×3，其中乘以3表示重复3次；

所述残差U型模块RSU7、RSU6、RSU5、RSU4、RSU4F编码结构和解码结构之间进行跳跃连接。

4.根据权利要求3所述的混凝土表观裂缝分割方法，其特征在于，所述conv3×3模块包括3×3的卷积、批标准化和非线性激活组合。

5.根据权利要求3所述的混凝土表观裂缝分割方法，其特征在于，在粗分割模块的解码结构中，对上采样、RSU4F、上采样、RSU4、上采样、RSU5、上采样、RSU6、上采样、RSU7中每一模块输出的特征图通过1×1卷积预测相应特征对应类别，并上采样到原图大小，通过激活函数Sigmoid得到对应存在裂缝的概率矩阵p₁至p₆，计算过程表示为：

Sigmoid(UpSampling₃₂(Conv2D(RSU4F)))→p₆,

Sigmoid(UpSampling₁₆(Conv2D(RSU4F)))→p₅,

Sigmoid(UpSampling₈(Conv2D(RSU4)))→p₄，

Sigmoid(UpSampling₄(Conv2D(RSU5)))→p₃，

Sigmoid(UpSampling₂(Conv2D(RSU6)))→p₂，

Sigmoid(Conv2D(RSU7))→p₁，

Sigmoid(Conv2D(Concatenate([p₁,p₂,p₃,p₄,p₅,p₆])))→p

其中UpSampling_k中的k表示上采样UpSampling系数。

6.根据权利要求1所述的混凝土表观裂缝分割方法，其特征在于，步骤3训练过程中对图像数据进行增强操作，所述增强操作包括：左右翻转、上下翻转、分段仿射、裁剪、旋转90度、欢度变换，训练时从所述增强操作中任选一种进行；

7.根据权利要求1所述的混凝土表观裂缝分割方法，其特征在于，所述步骤(5)插值过程为：

8.根据权利要求1所述的混凝土表观裂缝分割方法，其特征在于，步骤(4)对于重合部分，合并原则为优先保留当前子图为裂缝的预测结果。