CN110288020A

CN110288020A - 基于声波传播方程的双路耦合深度学习的目标分类方法

Info

Publication number: CN110288020A
Application number: CN201910556032.2A
Authority: CN
Inventors: 孙卫涛
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-06-19
Filing date: 2019-06-25
Publication date: 2019-09-27
Anticipated expiration: 2039-06-25
Also published as: WO2020258615A1; CN110288020B

Abstract

本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法，采用预设深度神经网络分类模型确定出待分类目标所属的类别，由于隐藏层具有两路耦合结构和跨层跳跃连接结构，可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力，可以克服“梯度消失”的问题，使SWTNN分类模型的训练精度和分类精度得到提高，进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且，本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的，具有明确的物理和数学意义，是一种可解释的深度神经网络分类模型，这是另一个重要技术突破，具有很强的创新性。

Description

基于声波传播方程的双路耦合深度学习的目标分类方法

技术领域

本发明涉及图像分类处理技术领域，更具体地，涉及基于声波传播方程的双路耦合深度学习的目标分类方法。

背景技术

目标识别是图像分类处理技术领域中的重要分支，如何快速并且准确地实现图像的分类是当前的研究热点。近年来，大量研究学者采用神经网络构建分类模型进行目标分类。

神经网络可包括卷积神经网络以及残差神经网络(Residual Neural Network，ResNet)等。而现有的卷积神经网络以及残差神经网络由于其网络结构的固有性质，导致应用其构建的分类模型的训练精度和分类精度均无法保证，进而无法保证目标识别的效率和准确度。

因此现急需提供一种基于声波传播方程的双路耦合深度学习的目标分类方法，以解决上述问题。

发明内容

为克服上述问题或者至少部分地解决上述问题，本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法。

第一方面，本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法，包括：

获取待分类目标的原始图片；

将所述原始图片输入至预设深度神经网络分类模型中，由所述预设深度神经网络分类模型输出所述待分类目标所属的类别；

其中，所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建；所述预设深度神经网络分类模型包括：输入部分、隐藏层和输出部分，所述输入部分、所述隐藏层和所述输出部分依次连接，所述输入部分设置有输入变量和伴随输入变量，所述隐藏层具有两路耦合结构和跨层跳跃连接结构。

优选地，所述输入变量为振动速度变量，所述伴随输入变量为声波压力变量；或者，

所述输入变量为声波压力变量，所述伴随输入变量为振动速度变量。

优选地，所述隐藏层包括至少一个阶段组，所述阶段组中包括四个阶段，每个阶段均包括压力卷积单元和速度卷积单元，相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接，前一阶段的速度卷积单元与后一阶段的压力卷积单元连接；

对于除所述隐藏层中与所述输入部分连接的阶段组中的第一阶段、第二阶段以及所述隐藏层中与所述输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段，所述阶段中压力卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中压力卷积单元的输入与所述阶段的前一阶段中速度卷积单元的输出的相加结果，所述阶段中压力卷积单元的输出与所述阶段的前一阶段中速度卷积单元的输入的相加结果作为所述阶段的后一阶段中速度卷积单元的输入；所述阶段中速度卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中速度卷积单元的输入与所述阶段的前一阶段中压力卷积单元的输出的相加结果，所述阶段中速度卷积单元的输出与所述阶段的前一阶段中压力卷积单元的输入的相加结果作为所述阶段的后一阶段中压力卷积单元的输入；

所述第一阶段中压力卷积单元的输入为所述振动速度变量经所述输入部分后的输出结果，所述第一阶段中压力卷积单元的输出与第一预设矩阵的相加结果作为所述第二阶段中速度卷积单元的输入；所述第一阶段中速度卷积单元的输入为所述声波压力变量经所述输入部分后的输出结果，所述第一阶段中速度卷积单元的输出与第二预设矩阵的相加结果作为所述第二阶段中压力卷积单元的输入；所述第四阶段中压力卷积单元的输出或所述第四阶段中速度卷积单元的输出与所述输出部分连接。

优选地，每个压力卷积单元和每个速度卷积单元中均包括两个滤波器，每个滤波器中包括预设数量个卷积核；

每个压力卷积单元和每个速度卷积单元中的两个滤波器之间通过激活层实现连接。

优选地，所述隐藏层的数据结构具体为：

其中，j为所述隐藏层中所有阶段中的第j阶段，3≤j+2≤K，K为所述隐藏层中所有阶段的数量，p_j+2为第j+2阶段中压力卷积单元的输入，p_j为第j阶段中压力卷积单元的输入，v_j+1为第j+1阶段中速度卷积单元的输入，为第j+1阶段中压力卷积单元中第一个滤波器的传递函数，为第j+1阶段中压力卷积单元中第二个滤波器的传递函数，σ_j+1为第j+1阶段中压力卷积单元以及速度卷积单元中激活层的激活函数，v_j+2为第j+2阶段中速度卷积单元的输入，v_j为第j阶段中速度卷积单元的输入，p_j+1为第j+1阶段中压力卷积单元的输入，为第j+1阶段中速度卷积单元中第一个滤波器的传递函数，为第j+1阶段中速度卷积单元中第二个滤波器的传递函数。

优选地，所述跨层跳跃连接结构中包括卷积层和多个归一化层。

优选地，所述输出部分包括：池化层、全连接层、softmax层和分类层。

第二方面，本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类系统，包括：

图片获取模块，用于获取待分类目标的原始图片；

类别确定模块，用于将所述原始图片输入至预设深度神经网络分类模型中，由所述预设深度神经网络分类模型输出所述待分类目标所属的类别；

第三方面，本发明实施例提供了一种电子设备，包括：

至少一个处理器、至少一个存储器、通信接口和总线；其中，

所述处理器、存储器、通信接口通过所述总线完成相互间的通信；

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令，以执行第一方面提供的基于声波传播方程的双路耦合深度学习的目标分类方法。

第四方面，本发明实施例提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行第一方面提供的基于声波传播方程的双路耦合深度学习的目标分类方法。

本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法，采用预设深度神经网络分类模型确定出待分类目标所属的类别，由于隐藏层具有两路耦合结构和跨层跳跃连接结构，可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力，可以克服“梯度消失”的问题，使SWTNN分类模型的训练精度和分类精度得到提高，进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且，本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的，具有明确的物理和数学意义，是一种可解释的深度神经网络分类模型，这是另一个重要技术突破，具有很强的创新性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法的流程示意图；

图2为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法中SWTNN分类模型的结构示意图；

图3为本发明实施例提供的一种SWTNN分类模型中隐藏层的结构示意图；

图4为本发明实施例提供的一种SWTNN分类模型中隐藏层的结构示意图；

图5为本发明实施例提供的一种SWTNN分类模型中隐藏层中的一个压力卷积单元的结构示意图；

图6为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图；

图7为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图；

图8为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图；

图9为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图；

图10为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图；

图11为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图；

图12为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图；

图13为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图；

图14为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图；

图15为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图；

图16为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图；

图17为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图；

图18为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图；

图19为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图；

图20为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图；

图21为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图；

图22为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类系统的结构示意图；

图23为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法，包括：

S1，获取待分类目标的原始图片；

S2，将所述原始图片输入至预设深度神经网络分类模型中，由所述预设深度神经网络分类模型输出所述待分类目标所属的类别；

具体地，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，首先获取到待分类目标的原始图片，其中待分类目标可以是猫、狗等动物，还可以是花、草、树等植物，也可以是不同类别的农作物，只要是需要进行分类的目标均可以作为本申请的待分类目标。

本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法是基于预设深度神经网络分类模型实现对原始图片中的待分类目标进行分类的，具体是将原始图片输入至预设深度神经网络分类模型中，由预设深度神经网络分类模型输出待分类目标所属的类别。原始图片的输入方式可以是将原始图片的像素矩阵输入至预设深度神经网络分类模型中。原始图片的像素矩阵是指原始图片中各像素点的取值形成的矩阵，像素矩阵中元素与原始图片中像素点一一对应。

本发明实施例中采用的预设深度神经网络分类模型是基于频率域一阶声波传播方程和有限差分算法构建，并基于包含有所属类别已知的目标样本的图片样本训练得到。

首先，利用频率域一阶声波传播方程，得到振动速度与声波压力之间的关系；

然后，利用有限差分方法中心差分格式，建立预设深度神经网络分类模型的传播函数，预设深度神经网络分类模型中含有振动速度、声波压力两条更新路径，且具有两路耦合结构和跨层跳跃连接结构，使预设深度神经网络分类模型具有更高的训练精度以及分类精度。

介质中时间域一阶声波传播方程可以通过公式(1)表示：

其中，r表示介质中物质质点的空间坐标，p(r,t)表示t时刻r处的声波压力，v(r,t)表示t时刻r处的物质质点的振动速度，ρ(r)表示r处的介质密度，c(r)表示r处的介质中声波传播速度，为常数，为空间梯度算子。

时间域一阶声波传播方程描述了介质中压力的传播，它与介质密度和刚度有关。当压力通过介质时，质量粒子在局部位置振动。

通过傅里叶变换，可以将公式(1)中表示的一阶声波传播方程转换为频率域一阶声波传播方程，如公式(2)所示：

其中，ω为经傅里叶变换得到的频率。

本发明实施例中提供的有限差分(Finite Difference，FD)算法是一种求偏微分(或常微分)方程和方程组定解问题的数值解的方法，有限差分算法可包括中心差分格式，公式(2)中的空间梯度算子通过中心差分格式表示为公式(3)的形式来近似计算。

其中，v_j+2为第j+2个振动速度值，v_j+1为第j+1个振动速度值，v_j为第j个振动速度值，U_j+1＝-2Δx·iω/ρc²为第j+1个速度差分系数，p_j+2为第j+2个声波压力值，p_j为第j个声波压力值，W_j+1＝-2Δx·iωρ为第j+1个压力差分系数，Δx为v_j+2与v_j的横坐标x的差值以及p_j+2与p_j的横坐标x的差值，3≤j+2≤M，M为中心差分格式中的差分数量。

从公式(3)可知，利用振动速度值v_j+1和声波压力值p_j可以更新声波压力值p_j+2，因此，本发明实施例中可以将公式(3)作为预设深度神经网络分类模型的传播函数，声波通过介质的传输过程可以等效为声波从预设深度神经网络分类模型的输入部分传输至输出部分的行为。因此，本发明实施例中采用的预设深度神经网络分类模型实际上是一种声波传播方程神经网络(Sound Wave Travel Neural Network，SWTNN)分类模型。

如图2所示，本发明实施例中SWTNN分类模型包括：输入部分21、隐藏层22和输出部分23，输入部分21、隐藏层22和输出部分23依次连接，输入部分设置有输入变量和伴随输入变量，既可以将声波压力作为输入变量，也可以将振动速度作为输入变量。本发明实施例中提供的SWTNN分类模型，无论是将声波压力还是振动速度作为输入变量，均不会影响SWTNN分类模型的应用。SWTNN分类模型在应用时，将原始图片作为输入变量输入至SWTNN分类模型后，SWTNN分类模型即可输出原始图片中待分类目标所属的类别。

本发明实施例中提供的SWTNN分类模型中，隐藏层具有两路耦合结构和跨层跳跃连接结构，两路耦合结构是指分两路同时对输入变量和伴随输入变量进行处理，两路即相互独立又在处理过程中实现两路交叉耦合，即与输入变量对应的一路既处理输入变量还处理伴随输入变量，与伴随输入变量对应的一路也既处理伴随输入变量还处理输入变量。跨层跳跃连接结构是指对于每一路来说，在隐藏层的多层结构中每隔一层实现一次连接。

对预设深度神经网络分类模型的训练过程可等价于给定输入部分和输出部分的数据，求解一个波动方程参数的优化反演问题。将输入变量视为引起输出部分的质点共振的振动源，用声波方程的数值算法解释预设深度神经网络分类模型的输入-输出之间的关系更加易于理解。基于包含有所属类别已知的目标样本的图片样本训练得到。

预设深度神经网络分类模型的训练可通过如下流程体现：

1)确定包含有所属类别已知的目标样本的图片样本，将图片样本作为预设深度神经网络分类模型的输入，将目标样本的所属类别作为预设深度神经网络分类模型的输出，对预设深度神经网络分类模型进行训练，训练过程相当于估计声波传播路径上(即预设深度神经网络分类模型的隐含层内部)的“密度”和“刚度”；

2)通过调整预设深度神经网络分类模型中隐含层内各阶段的权重，可以得到由输入部分的输入变量引起的输出部分的期望数值，这是一个定义明确的物理问题；

3)通过中心差分格式求解方程，得到了一个声波传播方程神经网络算法，通过调整有限差分系数，可以得到输出部分的期望值。

在训练过程中，将图片样本中的80％作为训练集进行上述训练，然后将图片样本中的20％作为评估集对经上述训练后得到的预设深度神经网络分类模型进行评估，根据评估结果决定是否需要进一步训练。

本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，采用预设深度神经网络分类模型确定出待分类目标所属的类别，由于隐藏层具有两路耦合结构和跨层跳跃连接结构，可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力，可以克服“梯度消失”的问题，使SWTNN分类模型的训练精度和分类精度得到提高，进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且，本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的，具有明确的物理和数学意义，是一种可解释的深度神经网络分类模型，这是另一个重要技术突破，具有很强的创新性。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，输入部分还可以包括激活层和多个归一化层，用以对输入变量进行处理，以使处理后的输入变量符合隐藏层的输入要求。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，所述输入变量为振动速度变量，所述伴随输入变量为声波压力变量；或者，所述输入变量为声波压力变量，所述伴随输入变量为振动速度变量。

具体地，本发明实施例中可以采用“压力边界条件”，即声波压力为输入变量，振动速度为伴随输入变量，将原始图片作为声波压力变量输入，将振动速度设置为0。本发明实施例中还可以采用“速度边界条件”，即振动速度为输入变量，声波压力为伴随输入变量，将原始图片作为振动速度变量输入，声波压力设置为0。

本发明实施例中振动速度是与声波压力耦合的伴随特征，具有额外的物理意义。声波压力是对物质质点处由质量膨胀和收缩引起的应变的测量。而振动速度则描述了物质质点的运动速度。通过引入伴随变量，将互补信息集成到预设深度神经网络分类模型中，防止了SWTNN分类模型中梯度的消失。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，隐藏层包括至少一个阶段组，所述阶段组中包括四个阶段，每个阶段均包括压力卷积单元和速度卷积单元，相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接，前一阶段的速度卷积单元与后一阶段的压力卷积单元连接。

所述第一阶段中压力卷积单元的输入为所述速度输入变量经所述输入部分后的输出结果，所述第一阶段中压力卷积单元的输出与第一预设矩阵的相加结果作为所述第二阶段中速度卷积单元的输入；所述第一阶段中速度卷积单元的输入为所述压力输入变量经所述输入部分后的输出结果，所述第一阶段中速度卷积单元的输出与第二预设矩阵的相加结果作为所述第二阶段中压力卷积单元的输入；所述第四阶段中压力卷积单元的输出或所述阶段中速度卷积单元的输出与所述输出部分连接。

具体地，本发明实施例中的隐藏层是一个多层结构，将多层结构描述为多阶段结构，隐藏层具体包括至少一个阶段组，阶段组的个数可以根据需要进行设置，本发明实施例中对此不作具体限定。

每个阶段中均包括一个压力卷积单元和一个速度卷积单元，与声波压力对应的一路包括各阶段的压力神经元和压力卷积单元，与振动速度对应的一路包括各阶段的速度神经元和速度卷积单元。本发明实施例中压力卷积单元的输入可以用速度神经元表示，速度卷积单元的输入可以用压力神经元表示。

对于除隐藏层中与输入部分连接的阶段组中的第一阶段、第二阶段以及隐藏层中与输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段k(3≤k≤K，K为隐藏层中所有阶段的数量)，阶段k中压力卷积单元的输入为阶段k前与阶段k间隔一个阶段的前二阶段(即阶段k-2)中压力卷积单元的输入与阶段k的前一阶段(即阶段k-1)中速度卷积单元的输出的相加结果，阶段k中压力卷积单元的输出与阶段k-1中速度卷积单元的输入的相加结果作为阶段k的后一阶段(即阶段k+1)中速度卷积单元的输入；阶段k中速度卷积单元的输入为阶段k-2中速度卷积单元的输入与阶段k-1中压力卷积单元的输出的相加结果，阶段k中速度卷积单元的输出与阶段k-1中压力卷积单元的输入的相加结果作为阶段k+1中压力卷积单元的输入。

对于除隐藏层中的第一阶段中压力卷积单元w₁的输入v₁为振动速度变量经输入部分后的输出结果，第一阶段中压力卷积单元w₁的输出与第一预设矩阵A的相加结果作为第二阶段中速度卷积单元u₂的输入p₂；第一阶段中速度卷积单元u₁的输入p₁为声波压力变量经输入部分后的输出结果，第一阶段中速度卷积单元u₁的输出与第二预设矩阵B的相加结果作为第二阶段中压力卷积单元w₂的输入v₂；第四阶段中压力卷积单元w_K的输出或第四阶段中速度卷积单元u_K的输出与输出部分连接。其中，第一预设矩阵A与第二预设矩阵B可以根据需要进行设置。但是需要保证的是，第一预设矩阵A与第一阶段中压力卷积单元w₁的输出维度相同，第二预设矩阵B与第一阶段中速度卷积单元u₁的输出维度相同。

如图3所示，为本发明实施例中提供的预设深度神经网络分类模型中隐藏层的结构示意图，图3中实线连接为两路耦合结构，虚线连接为跨层跳跃连接结构。图3中仅示出了其中一个阶段组，设该阶段组中的第一个阶段为整个隐藏层中的第j个阶段，该阶段组中的第二个阶段为整个隐藏层中的第j+1个阶段，该阶段组中的第三个阶段为整个隐藏层中的第j+2个阶段，该阶段组中的第四个阶段为整个隐藏层中的第j+3个阶段。其中，第j、j+1、j+2、j+3个阶段中的压力卷积单元分别用w_j、w_j+1、w_j+2、w_j+3表示，压力神经元分别用p_j、p_j+1、p_j+2、p_j+3、p_j+4表示。第j、j+1、j+2、j+3个阶段中的速度卷积单元分别用u_j、u_j+1、u_j+2、u_j+3表示，速度神经元分别用v_j、v_j+1、v_j+2、v_j+3、v_j+4表示。w_j、u_j+1、w_j+2、u_j+3通过神经元p_j+1、v_j+2、p_j+3依次连接，u_j、w_j+1、u_j+2、w_j+3通过神经元v_j+1、p_j+2、v_j+3依次连接。其中，w_j、w_j+1、w_j+2、w_j+3分别表示对应的压力卷积单元的传递函数，也即对应的压力卷积单元两端连接的神经元的连接权重，即分别对应于公式(3)中的压力差分系数，u_j、u_j+1、u_j+2、u_j+3分别表示对应的速度卷积单元的传递函数，也即对应的速度卷积单元两端连接的神经元的连接权重，即分别对应于公式(3)中的速度差分系数。

以图3中第j+2个阶段为例，第j+2个阶段中压力卷积单元w_j+2的输入为速度神经元v_j+2，v_j+2具体为第j个阶段中压力卷积单元w_j的输入v_j与第j个阶段中速度卷积单元u_j的输出的相加结果，第j+2个阶段中压力卷积单元w_j+2的输出与第j+1个阶段中速度卷积单元u_j+1的输入p_j+1的相加结果作为第j+3个阶段中速度卷积单元u_j+3的输入p_j+3；第j+2个阶段中速度卷积单元u_j+2的输入p_j+2为第j个阶段中速度卷积单元u_j的输入p_j与第j+1个阶段中压力卷积单元w_j+1的输出的相加结果，第j+2个阶段中速度卷积单元u_j+2的输出与第j+1个阶段中压力卷积单元w_j+1的输入v_j+1的相加结果作为第j+3个阶段中压力卷积单元w_j+3的输入v_j+3。

以声波压力作为输入变量时，输出部分的输入由声波压力对应的一路的输出确定，即为隐藏层中的最后一个压力神经元p_K。以振动速度作为输入变量时，输出部分的输入则由振动速度对应的一路的输出确定，即为隐藏层中的最后一个速度神经元v_K。

若隐藏层中仅具有一个阶段组，阶段组中包括4个阶段，则隐藏层的结构如图4所示，图4中以声波压力作为输入变量，对应的伴随输入变量为振动速度，设置为0。隐藏层中第1、2、3、4个阶段中的压力卷积单元分别用w₁、w₂、w₃、w₄表示，压力神经元分别用p₁、p₂、p₃、p₄、p₅表示。第1、2、3、4个阶段中的速度卷积单元分别用u₁、u₂、u₃、u₄表示，速度神经元分别用v₁、v₂、v₃、v₄、v₅表示。输出部分的输入为隐藏层中的最后一个压力神经元p₅。当以振动速度作为输入变量，对应的伴随输入变量为声波压力，设置为0。输出部分的输入为隐藏层中的最后一个压力神经元v₅。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，每个压力卷积单元和每个速度卷积单元中均包括两个滤波器，每个滤波器中包括预设数量个卷积核；

具体地，如图5所示，为一个压力卷积单元5的结构示意图，图5中包括第一滤波器51和第二滤波器52，第一滤波器51和第二滤波器52之间通过激活层53实现连接。需要说明的是，本发明实施例中每个压力卷积单元和每个速度卷积单元中的两个滤波器均是相同的，均是由N个卷积核构成，实现N次卷积，即在一个压力卷积单元和一个速度卷积单元中先进行N次卷积，然后再通过激活层进行激活，最后再进行N次卷积输出。N的具体取值可以根据需要进行设置，例如3、4、7、8等。

需要说明的是，N是一个控制参数，表征预设深度神经网络分类模型的网络深度。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，所述隐藏层的数据结构具体为：

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，所述跨层跳跃连接结构中包括卷积层和多个归一化层。

具体地，本发明实施例中提供的跨层跳跃连接结构中包括卷积层和多个归一化层，即在图3中的虚线上设置一个卷积层和多个归一化层，用以使第j+2个阶段中压力卷积单元w_j+2的输出与第j+1个阶段中速度卷积单元u_j+1的输入p_j+1进行相加之前，将第j+1个阶段中速度卷积单元u_j+1的输入p_j+1进行一次卷积以及多次归一化处理，保证处理后的p_j+1与w_j+2的输出顺利实现相加。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，所述输出部分包括：池化层、全连接层、softmax层和分类层。

池化层、全连接层、softmax层和分类层依次连接，最后由分类层输出待分类目标所属的类别。

在上述实施例的基础上，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，以SWTNN分类模型的隐藏层包括一个阶段组为例，隐藏层的结构如图4所示，其中SWTNN分类模型的网络深度N的取值分别为3、4、7、8。第1、2、3、4个阶段中的压力卷积单元和速度卷积单元中的滤波器的特征尺寸分别为32×32、16×16、8×8和4×4，即第1个阶段中各滤波器中的卷积核的尺寸为32×32，第2个阶段中各滤波器中的卷积核的尺寸为16×16，第3个阶段中各滤波器中的卷积核的尺寸为8×8，第4个阶段中各滤波器中的卷积核的尺寸为4×4。跨层跳跃连接结构中的卷积层中卷积核的尺寸为1×1。同时，构建一个三级ResNet，ResNet的网络深度的取值分别为3、4、7、8。卷积层的特征尺寸分别为32×32、16×16和8×8。分别使用CIFAR-10、CIFAR-100的图像数据集对本发明实施例中SWTNN分类模型以及现有技术中的ResNet的训练精度以及分类精度(以下均用评估精度表示)进行评估。

如图6所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图，如图7所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图。图7中直线为1:1线，从图7中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练精度高于现有技术中的ResNet的训练精度。如图8所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图，如图9所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图。图9中直线为1:1线，从图9中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估精度高于现有技术中的ResNet的评估精度。

如图10所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图，如图11所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图。图11中直线为1:1线，从图11中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练损失高于现有技术中的ResNet的训练损失。如图12所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图，如图13所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图。图13中直线为1:1线，从图13中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估损失在最后阶段低于现有技术中的ResNet的评估损失。

如图14所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图，如图15所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图。图15中直线为1:1线，从图15中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练精度高于现有技术中的ResNet的训练精度。如图16所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图，如图17所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图。图17中直线为1:1线，从图17中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估精度高于现有技术中的ResNet的评估精度。

如图18所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图，如图19所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图。图19中直线为1:1线，从图19中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练损失高于现有技术中的ResNet的训练损失。如图20所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图，如图21所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图。图21中直线为1:1线，从图21中可以看出，在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估损失在最后阶段低于现有技术中的ResNet的评估损失。

本发明实施例中图6-图21中的SWTNN3-SWTNN8表示SWTNN分类模型中N＝3-8时对应的曲线，ResNet3-ResNet8表示ResNet中N＝3-8时对应的曲线。

由于原始的训练精度曲线以及评估精度曲线的波动较大，因此为了便于比较，分别对原始的训练精度曲线以及评估精度曲线进行了窗长501的平滑处理，得到如图6、8、10、12、14、16、18、20示出的曲线。

从图6、图8、图14、图16中可以知晓，SWTNN分类模型的训练精度以及评估精度均随训练迭代次数的增加而增加。从图10、图12、图18、图20中可以知晓，SWTNN分类模型的训练损失以及评估损失均随训练迭代次数的增加而减少。

如图7和图9所示，当训练精度和评估精度分别达到95％左右时，SWTNN分类模型与ResNet的训练精度比值以及评估精度比值均超过1:1，说明SWTNN分类模型的训练精度高于的ResNet训练精度，SWTNN分类模型的评估精度高于ResNet的评估精度。

当网络深度从N＝3增加到N＝8时，如表1所示，CIFAR-10的图像数据集对应的ResNet的评估精度为88.76％-88.78％，可以发现ResNet在评估精度上性能提升难以区分，而SWTNN分类模型的分类准确率从90.38％明显提高到91.82％。如表2所示，CIFAR-100的图像数据集对应的ResNet的评估精度从72.72％下降至71.59％，而SWTNN分类模型的分类准确率从74.86％明显提高到78.31％。有趣的是，在训练过程中，如图6所示，SWTNN分类模型的训练精度并不总是优于ResNet的训练精度。当训练和评估精度低于80％时，SWTNN分类模型与ResNet的数据点大多在1:1线以下。随着训练步骤的进行，数据点跳到了1:1线以上。SWTNN分类模型的训练精度在训练运行的后期超过了ResNet。

表1 CIFAR-10的图像数据集下SWTNN分类模型与ResNet的参数比较表

N	训练精度	评估精度	训练损失	评估损失
					SWTNN3	98.02％	90.38％	0.063	0.311
SWTNN4	98.44％	91.32％	0.044	0.290
					SWTNN7	98.74％	91.73％	0.035	0.275
SWTNN8	99.06％	91.82％	0.022	0.281
					ResNet3	96.88％	88.60％	0.119	0.350
ResNet4	95.45％	88.71％	0.135	0.344
					ResNet7	95.57％	89.00％	0.137	0.342
ResNet8	95.33％	88.96％	0.134	0.343

表2 CIFAR-100的图像数据集下SWTNN分类模型与ResNet的参数比较表

N	训练精度	评估精度	训练损失	评估损失
					SWTNN3	89.92％	74.86％	0.309	0.846
SWTNN4	92.19％	76.98％	0.241	0.771
					SWTNN7	95.31％	77.41％	0.143	0.765
SWTNN8	95.56％	78.31％	0.135	0.747
					ResNet3	83.59％	72.33％	0.535	0.895
ResNet4	88.28％	72.61％	0.441	0.872
					ResNet7	83.59％	73.51％	0.512	0.860
ResNet8	82.41％	72.27％	0.539	0.892

通过CIFAR-100的图像数据集对SWTNN分类模型和ResNet进行评估时可以发现，从训练精度和评估精度曲线可以得出与通过CIFAR-10的图像数据集评估时相同的结论。CIFAR-100结果的一个小差异是，SWTNN分类模型与ResNet的数据点在更大的范围(从50％开始)远高于1:1线，对于CIFAR-100的图像数据集来说，这意味着SWTNN分类模型的准确性比ResNet好得多。

本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法，基于具有明确意义的物理过程和数值计算方法，构建了含两路耦合结构和跨层跳跃连接结构的预设深度神经网络分类模型，引入伴随输入变量后预设深度神经网络分类模型的训练精度和评估精度都得到很大提高。该技术的重要创新之处在于突破了传统单变量传播的网络模型，在预设深度神经网络分类模型中引入了两个变量更新途径相互耦合机制，大大改善了预设深度神经网络分类模型“梯度消失”问题，具有很强的创新性。

如图22所示，在上述实施例的基础上，本发明实施例中提供了一种基于声波传播方程的双路耦合深度学习的目标分类系统，包括：图片获取模块221和类别确定模块222。其中，

图片获取模块221用于获取待分类目标的原始图片；

类别确定模块222用于将所述原始图片输入至预设深度神经网络分类模型中，由所述预设深度神经网络分类模型输出所述待分类目标所属的类别；

具体地，本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类系统中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的，实现的效果也是一致的，本发明实施例中对此不再赘述。

图23所示，在上述实施例的基础上，本发明实施例中提供了一种电子设备，包括：处理器(processor)2301、存储器(memory)2302、通信接口(Communications Interface)2303和总线2304；其中，

所述处理器2301、存储器2302、通信接口2303通过总线2304完成相互间的通信。所述存储器2302存储有可被所述处理器2301执行的程序指令，处理器2301用于调用存储器2302中的程序指令，以执行上述各方法实施例所提供的方法。

存储器2302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在上述实施例的基础上，本发明实施例中提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，包括：

获取待分类目标的原始图片；

2.根据权利要求1所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，所述输入变量为振动速度变量，所述伴随输入变量为声波压力变量；或者，

3.根据权利要求2所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，所述隐藏层包括至少一个阶段组，所述阶段组中包括四个阶段，每个阶段均包括压力卷积单元和速度卷积单元，相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接，前一阶段的速度卷积单元与后一阶段的压力卷积单元连接；

4.根据权利要求3所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，每个压力卷积单元和每个速度卷积单元中均包括两个滤波器，每个滤波器中包括预设数量个卷积核；

5.根据权利要求4所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，所述隐藏层的数据结构具体为：

6.根据权利要求1-5中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，所述跨层跳跃连接结构中包括卷积层和多个归一化层。

7.根据权利要求1-5中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法，其特征在于，所述输出部分包括：池化层、全连接层、softmax层和分类层。

8.一种基于声波传播方程的双路耦合深度学习的目标分类系统，其特征在于，包括：

图片获取模块，用于获取待分类目标的原始图片；

9.一种电子设备，其特征在于，包括：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令，以执行如权利要求1-7中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1-7中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法。