CN110852316B

CN110852316B - 一种采用密集结构卷积网络的图像篡改检测和定位方法

Info

Publication number: CN110852316B
Application number: CN201911081464.9A
Authority: CN
Inventors: 张榕瑜; 倪江群
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-11-07
Filing date: 2019-11-07
Publication date: 2023-04-18
Anticipated expiration: 2039-11-07
Also published as: CN110852316A

Abstract

本发明提供的一种采用密集结构卷积网络的图像篡改检测和定位方法，包括输入待测图像，对待测进行空间富集SRM卷积进行预处理，得到预处理后的图像；构建密集连接卷积网络对预处理后的图像进行篡改图像特征提取，得到待测图像的二分类信息，完成对图像篡改的检测；构建与连接卷积网络结构对称的反卷积网络，将二分类信息作为输入；根据得到的图像篡改区域，由反卷积网络完成定位后的图像。本发明所提供的方法，将深度学习技术应用到图像篡改检测与定位中，适用于多种篡改手段，具有好的鲁棒性和实用性；提供了检测和定位的统一框架，不仅能够多图像是否经过篡改做出预测，还能对篡改区域进行预测，给出逐像素的精确标注，得到细致的物体轮廓边界。

Description

一种采用密集结构卷积网络的图像篡改检测和定位方法

技术领域

本发明涉及图像盲取证技术领域，更具体的，涉及一种采用密集结构卷积网络的图像篡改检测和定位方法。

背景技术

在信息时代，图像作为传播信息的主要方式之一，因为其具有直观的事物表现和思维导向，因此这种信息传播方式已经完全融入了人类的生活。然而，图像篡改技术的发展也突飞猛进，对多媒体内容安全带来的重大威胁不容忽视。当前的识别图像篡改技术主要分为基于人工特征提取的方法以及基于深度学习的方法。

基于人工特征提取的方法是对图像做各种变换，提取图像特征后使用阈值或者机器学习的方法进行分类，但该方法依赖于研究者对图像特征的建模，通常只适用于一种类型的图像篡改识别，也即虽然在一种篡改手段上有比较好的效果，但是对其他篡改手段的适用性不好，鲁棒性和可扩展性差；基于深度学习的方法通常只聚焦实现检测与定位中的一种，虽然在检测上能达到很高的准确率，但是无法发挥出深度学习在目标检测上的优越性能，没有充分利用检测和定位的联系性。

发明内容

本发明为克服现有的识别图像篡改技术存在无法同时实现图像篡改的检测和定位的技术缺陷，提供一种采用密集结构卷积网络的图像篡改检测和定位方法。

为解决上述技术问题，本发明的技术方案如下：

一种采用密集结构卷积网络的图像篡改检测和定位方法，包括以下步骤：

S1：输入待测图像，对待测进行空间富集SRM卷积进行预处理，得到预处理后的图像；

S2：构建密集连接卷积网络对预处理后的图像进行篡改图像特征提取，得到待测图像的二分类信息，完成对图像篡改的检测；

S3：构建与连接卷积网络结构对称的反卷积网络，将待测图像的二分类信息作为输入，定位图像篡改区域；

S4：根据得到的图像篡改区域，由反卷积网络完成定位后的图像，完成对图像篡改的定位。

其中，在所述步骤S2中，所述的密集连接卷积网络包括池化层、密集层、过渡层、全局平均池化层和全连接层；其中：

所述池化层对预处理后的图像进行一次卷积和最大池化操作，并将结果输入密集层中；

所述密集层、过渡层均设置有多层，每个密集层的输出结果均输入对应的过渡层中，最终由最后一层过渡层将得到的篡改图像特征图输入所述全局平均池化层中；

所述全局平均池化层将篡改图像特征图进行平均池化，并由所述全连接层计算输出两个概率值，分别代表篡改和非篡改的概率，得到待测图像的二分类信息。

其中，所述密集层包括多个基本结构层，每个基本结构层由两个连续的卷积层组成，其中每个基本结构层的输入都有前一层的输出进行合并操作而成，是残差结构的局部稠密版本。

其中，所述密集连接卷积网络设置有四个密集层，分别包含了5、10、20、12个基本结构层。

其中，所述过渡层包括一层卷积层，其对密集层输入的特征图先卷积一次，再进行平均池化，对图像尺寸进行缩小。

其中，所述全连接层通过softmax函数计算输出两个概率值，具体计算公式为：

其中，i代表两个类别篡改/非篡改，

代表网络在i类别上的输出值，y_i表示样本在i类别上的真实值，a_i代表i类别的权重。

上述方案中，为了更好地捕捉图像的篡改噪声特征，对输入图像的RGB三通道进行一次SRM卷积，卷积核用归一化后的SRM进行初始化，一个卷积核的三个通道都用同一个模型赋值，得到30个滤波器，卷积后的输出再和RGB三通道进行串联合并。

上述方案中，经过池化层进行池化操作后，利用密集连接卷积网络的密集层、过渡层构建深的网络便于提取篡改图像的特征。两个连续的卷积层构成一个基结构层，一个密集层可包括多个基本结构层，并且在一个密集层里每一个基本结构层的输入都是由前面层的所有输出经过合并操作构成的，这样的结构是残差结构的局部稠密版本，能有益于训练更深的网络而不至于过拟合。卷积网络中一种使用了四个密集层，分别包含5、10、20、12个基本结构，过渡层是一个卷积层，对输入的特征图先卷积一次，降低深度，然后进行平均池化，缩小尺寸。网络中使用的池化都是2x2池化，最后一个密集层后的特征图应为原尺寸的三十二分之一。全局平均池化层将特征图进行平均，只保留深度，经过全连接层后输出两个值，由softmax函数转化为概率值，分别代表篡改、非篡改的概率，取最大值为最终的判断结果。

上述方案中，在每个卷积层后都有批标准化和relu激活函数层，从而防止梯度爆炸或者弥散，引入非线性模型。

其中，在所述步骤S3中，所述反卷积网络包括全连接层，密集层及对应的反卷积过渡层；首先通过全连接层对篡改图像特征上逐点进行计算，然后通过密集层及对应的反卷积过渡层对图像继续逐层的还原，定位图像篡改区域。

其中，在所述步骤S4中，根据所述图像篡改区域，由反卷积网络输出待测图像定位后的二值图像，完成对图像篡改的定位。

上述方案中，本发明利用尽可能与卷积网络对称的结构构建反卷积网络，首先，移除了卷积网络中的全局池化层从而得以保留完整的特征图，对应的全连接层可以在特征图上逐点进行运算，即相当于1x1的卷积，接着是三个包含12、6、3个基本结构层的密集层以及反卷积过渡层，反卷积过渡层是对过渡层的改良，将平均池化替换成2x的反卷积层，从而增大一倍特征图的尺寸。

上述方案中，为了更好地补充输出图像的细节，本发明将前面卷积网络的输出通过直接连接、2x反卷积、4x反卷积操作后输入后面反卷积网络的层中，这样形成一种多尺寸的特征拼接，通过串联合并得到的特征图，可以研究多尺寸的上下文信息，从而有助于网络学习如何精准预测出篡改区域的边界、轮廓和大小；另外，本发明通过将全连接层输出进行逐级2x反卷积后连接到后面的层中去，提高其在网络决策中的重要性。本发明认为全连接层输出是一种有效的空间决策信息，因为在检测任务中全连接层被训练用于篡改的二分类，因此对此信息多加利用。

其中，所述密集连接卷积网络和反卷积网络的训练过程具体为：

采集训练图像数据并进行预处理；

将预处理后的图像数据分为训练集和测试集；

利用训练集对128x128图像进行预训练，计算梯度更新参数；

根据梯度更新参数对完整尺寸的图像训练，得到密集连接卷积网络的权重；

根据密集连接卷积网络的权重对反卷积网络进行128x128图像的预训练，计算梯度更新参数；

根据计算梯度更新参数对完整尺寸的图像训练，完成对反卷积网络的训练；

利用测试集对反卷积网络进行评估调整，最终输出对应权重的密集连接卷积网络和反卷积网络。

其中，所述密集连接卷积网络和反卷积网络训练调整过程中，采用五折交叉验证法进行调整，每次取预处理后的图像数据五分之一作为测试集，五分之四作为训练集，通过五次的训练评估，取平均训练的结果作为最终的结果。

上述方案中，本发明通过用128x128的小窗口滑动图像，将含有篡改区域的窗口保存为新的图像，并基于篡改区域大小的策略从窗口中筛选科学合理的样本。第一，为了不使篡改区域过大，只保留下篡改区域占比不超过40％的窗口；第二，为了避免篡改区域过小，舍弃篡改区域面积低于150个像素的窗口。这样可以防止样本图像篡改区域面积不合理问题出现，有助于网络对图像篡改检测的学习。同时，用数据增强的方法对图像进行多角度旋转，增强模型的旋转不变性。

上述方案中，训练围绕先检测后定位展开，先训练用于检测图像是否经过篡改的二分类卷积网络，然后保留卷积网络的权重，以定位篡改区域为目标训练，仅使用篡改训练样本更新卷积网络和反卷积网络。

上述方案中，训练时先用128x128的小图像计算梯度更新参数，充分利用图形处理器的显存，一直前向传播可以计算多个样本的梯度；在使用完整尺寸的数据集进行训练，而由于尺寸不均，一次前向传播只能计算一个样本的梯度。为了使损失能平稳下降，本发明用程序设置梯度累加器，对多次梯度进行平均后再更新一次参数。

与现有技术相比，本发明技术方案的有益效果是：

本发明提供的一种采用密集结构卷积网络的图像篡改检测和定位方法，将深度学习技术应用到图像篡改检测与定位中，训练网络学习到篡改图像的特征，适用于应付多种篡改手段，能在新的数据集前提下继续更新参数提高性能，具有好的鲁棒性和实用性；相对于其他深度学习方法，本发明实现了检测和定位的统一框架，不仅能够多图像是否经过篡改做出预测，还能对篡改区域进行预测，给出逐像素的精确标注，得到细致的物体轮廓边界。

附图说明

图1为本发明所述方法步骤流程图；

图2为卷积网络和反卷积网络结构示意图；

图3为卷积网络和反卷积网络训练流程图；

图4为定位测试样例的结果示意图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，一种采用密集结构卷积网络的图像篡改检测和定位方法，包括以下步骤：

更具体的，如图2所示，在所述步骤S2中，所述的密集连接卷积网络包括池化层、密集层、过渡层、全局平均池化层和全连接层；其中：

更具体的，所述密集层包括多个基本结构层，每个基本结构层由两个连续的卷积层组成，其中每个基本结构层的输入都有前一层的输出进行合并操作而成，是残差结构的局部稠密版本。

更具体的，所述密集连接卷积网络设置有四个密集层，分别包含了5、10、20、12个基本结构层。

更具体的，所述过渡层包括一层卷积层，其对密集层输入的特征图先卷积一次，再进行平均池化，对图像尺寸进行缩小。

更具体的，所述全连接层通过softmax函数计算输出两个概率值，具体计算公式为：

其中，i代表两个类别篡改/非篡改，

在具体实施过程中，为了更好地捕捉图像的篡改噪声特征，对输入图像的RGB三通道进行一次SRM卷积，卷积核用归一化后的SRM进行初始化，一个卷积核的三个通道都用同一个模型赋值，得到30个滤波器，卷积后的输出再和RGB三通道进行串联合并。

在具体实施过程中，经过池化层进行池化操作后，利用密集连接卷积网络的密集层、过渡层构建深的网络便于提取篡改图像的特征。两个连续的卷积层构成一个基结构层，一个密集层可包括多个基本结构层，并且在一个密集层里每一个基本结构层的输入都是由前面层的所有输出经过合并操作构成的，这样的结构是残差结构的局部稠密版本，能有益于训练更深的网络而不至于过拟合。卷积网络中一种使用了四个密集层，分别包含5、10、20、12个基本结构，过渡层是一个卷积层，对输入的特征图先卷积一次，降低深度，然后进行平均池化，缩小尺寸。网络中使用的池化都是2x2池化，最后一个密集层后的特征图应为原尺寸的三十二分之一。全局平均池化层将特征图进行平均，只保留深度，经过全连接层后输出两个值，由softmax函数转化为概率值，分别代表篡改、非篡改的概率，取最大值为最终的判断结果。

在具体实施过程中，在每个卷积层后都有批标准化和relu激活函数层，从而防止梯度爆炸或者弥散，引入非线性模型。

更具体的，如图2所示，在所述步骤S3中，所述反卷积网络包括全连接层，密集层及对应的反卷积过渡层；首先通过全连接层对篡改图像特征上逐点进行计算，然后通过密集层及对应的反卷积过渡层对图像继续逐层的还原，定位图像篡改区域。

更具体的，在所述步骤S4中，根据所述图像篡改区域，由反卷积网络输出待测图像定位后的二值图像，完成对图像篡改的定位。

在具体实施过程中，本发明利用尽可能与卷积网络对称的结构构建反卷积网络，首先，移除了卷积网络中的全局池化层从而得以保留完整的特征图，对应的全连接层可以在特征图上逐点进行运算，即相当于1x1的卷积，接着是三个包含12、6、3个基本结构层的密集层以及反卷积过渡层，反卷积过渡层是对过渡层的改良，将平均池化替换成2x的反卷积层，从而增大一倍特征图的尺寸。

在具体实施过程中，为了更好地补充输出图像的细节，本发明将前面卷积网络的输出通过直接连接、2x反卷积、4x反卷积操作后输入后面反卷积网络的层中，这样形成一种多尺寸的特征拼接，通过串联合并得到的特征图，可以研究多尺寸的上下文信息，从而有助于网络学习如何精准预测出篡改区域的边界、轮廓和大小；另外，本发明通过将全连接层输出进行逐级2x反卷积后连接到后面的层中去，提高其在网络决策中的重要性。本发明认为全连接层输出是一种有效的空间决策信息，因为在检测任务中全连接层被训练用于篡改的二分类，因此对此信息多加利用。

实施例2

更具体的，在实施例1的基础上，如图3所示，所述密集连接卷积网络和反卷积网络的训练过程具体为：

采集训练图像数据并进行预处理；

将预处理后的图像数据分为训练集和测试集；

利用训练集对128x128图像进行预训练，计算梯度更新参数；

更具体的，所述密集连接卷积网络和反卷积网络训练调整过程中，采用五折交叉验证法进行调整，每次取预处理后的图像数据五分之一作为测试集，五分之四作为训练集，通过五次的训练评估，取平均训练的结果作为最终的结果。

在具体实施过程中，本发明通过用128x128的小窗口滑动图像，将含有篡改区域的窗口保存为新的图像，并基于篡改区域大小的策略从窗口中筛选科学合理的样本。第一，为了不使篡改区域过大，只保留下篡改区域占比不超过40％的窗口；第二，为了避免篡改区域过小，舍弃篡改区域面积低于150个像素的窗口。这样可以防止样本图像篡改区域面积不合理问题出现，有助于网络对图像篡改检测的学习。同时，用数据增强的方法对图像进行多角度旋转，增强模型的旋转不变性。

在具体实施过程中，训练围绕先检测后定位展开，先训练用于检测图像是否经过篡改的二分类卷积网络，然后保留卷积网络的权重，以定位篡改区域为目标训练，仅使用篡改训练样本更新卷积网络和反卷积网络。

在具体实施过程中，训练时先用128x128的小图像计算梯度更新参数，充分利用图形处理器的显存，一直前向传播可以计算多个样本的梯度；在使用完整尺寸的数据集进行训练，而由于尺寸不均，一次前向传播只能计算一个样本的梯度。为了使损失能平稳下降，本发明用程序设置梯度累加器，对多次梯度进行平均后再更新一次参数。

实施例3

在具体实施过程中，本发明提出的网络使用Tensorflow深度学习框架搭建，可在一颗Geforce GTX 1080Ti GPU(图形处理器)上训练。样本为128x128大小时，更新一次参数可使用128张图像一次迭代。在大小从240×160到1000×1000像素不等的测试集上，检测一张图像是否经过篡改平均需要17.75毫秒，对一张篡改图像进行定位的平均时间是99.84毫秒。

在具体实施过程中，本发明使用多个公开数据集进行训练和测试，包括CASIAv1.0、CASIA v2.0、NC 2016和Columbia Umcompressed四个常用数据集。对模型进行五次训练测试后取平均结果，表1给出了在测试集上的分类平均准确率，平均像素分类准确率，平均交并比。准确率为分类正确样本数量与总样本数量的比值。交并比指的是真实篡改区域与预测篡改区域的交集与并集的比值，介于0到1之间，越大表明重合程度愈高，即模型的性能愈好。

表1

在具体实施过程中，一些定位测试样例的结果如图4所示，白色像素代表篡改的区域。由于卷积网络全局池化层的去除，全连接层输出一个2通道的特征图，将其可视化如第四列，可见该层输出有效的空间决策信息，大致地给出预测位置。反卷积网络利用此信息以及通过与浅层网络密集连接，进一步精准预测。本发明提出的密集结构卷积神经网络能够有效地识别拼接、复制移动、去除的篡改手段，并且输出逐像素分类的结果，能够精准地预测被篡改的对象、大小、形状，贴近真实标注。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，包括以下步骤：

S4：根据得到的图像篡改区域，由反卷积网络完成定位后的图像，完成对图像篡改的定位；

在所述步骤S2中，所述的密集连接卷积网络包括池化层、密集层、过渡层、全局平均池化层和全连接层；其中：

所述全局平均池化层将篡改图像特征图进行平均池化，并由所述全连接层计算输出两个概率值，分别代表篡改和非篡改的概率，得到待测图像的二分类信息；

所述密集层包括多个基本结构层，每个基本结构层由两个连续的卷积层组成，其中每个基本结构层的输入都有前一层的输出进行合并操作而成，是残差结构的局部稠密版本；

所述密集连接卷积网络设置有四个密集层，分别包含了5、10、20、12个基本结构层；

所述过渡层包括一层卷积层，其对密集层输入的特征图先卷积一次，再进行平均池化，对图像尺寸进行缩小。

2.根据权利要求1所述的一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，所述全连接层通过softmax函数计算输出两个概率值，具体计算公式为：

其中，i代表两个类别篡改/非篡改，代表网络在i类别上的输出值，y_i表示样本在i类别上的真实值，a_i代表i类别的权重。

3.根据权利要求1所述的一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，在所述步骤S3中，所述反卷积网络包括全连接层，密集层及对应的反卷积过渡层；首先通过全连接层对篡改图像特征上逐点进行计算，然后通过密集层及对应的反卷积过渡层对图像继续逐层的还原，定位图像篡改区域。

4.根据权利要求3所述的一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，在所述步骤S4中，根据所述图像篡改区域，由反卷积网络输出待测图像定位后的二值图像，完成对图像篡改的定位。

5.根据权利要求4所述的一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，所述密集连接卷积网络和反卷积网络的训练过程具体为：

采集训练图像数据并进行预处理；

将预处理后的图像数据分为训练集和测试集；

利用训练集对128x128图像进行预训练，计算梯度更新参数；

6.根据权利要求5所述的一种采用密集结构卷积网络的图像篡改检测和定位方法，其特征在于，所述密集连接卷积网络和反卷积网络训练调整过程中，采用五折交叉验证法进行调整，每次取预处理后的图像数据五分之一作为测试集，五分之四作为训练集，通过五次的训练评估，取平均训练的结果作为最终的结果。