CN110288020A - 基于声波传播方程的双路耦合深度学习的目标分类方法 - Google Patents
基于声波传播方程的双路耦合深度学习的目标分类方法 Download PDFInfo
- Publication number
- CN110288020A CN110288020A CN201910556032.2A CN201910556032A CN110288020A CN 110288020 A CN110288020 A CN 110288020A CN 201910556032 A CN201910556032 A CN 201910556032A CN 110288020 A CN110288020 A CN 110288020A
- Authority
- CN
- China
- Prior art keywords
- stage
- input
- convolution unit
- pressure
- velocity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000013135 deep learning Methods 0.000 title claims abstract description 37
- 230000008878 coupling Effects 0.000 title claims abstract description 31
- 238000010168 coupling process Methods 0.000 title claims abstract description 31
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 31
- 238000013145 classification model Methods 0.000 claims abstract description 142
- 238000013528 artificial neural network Methods 0.000 claims abstract description 67
- 230000006870 function Effects 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000012546 transfer Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 84
- 230000008034 disappearance Effects 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 description 50
- 238000010586 diagram Methods 0.000 description 31
- 210000002569 neuron Anatomy 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 238000010606 normalization Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000006880 cross-coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法,采用预设深度神经网络分类模型确定出待分类目标所属的类别,由于隐藏层具有两路耦合结构和跨层跳跃连接结构,可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力,可以克服“梯度消失”的问题,使SWTNN分类模型的训练精度和分类精度得到提高,进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且,本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的,具有明确的物理和数学意义,是一种可解释的深度神经网络分类模型,这是另一个重要技术突破,具有很强的创新性。
Description
技术领域
本发明涉及图像分类处理技术领域,更具体地,涉及基于声波传播方程的双路耦合深度学习的目标分类方法。
背景技术
目标识别是图像分类处理技术领域中的重要分支,如何快速并且准确地实现图像的分类是当前的研究热点。近年来,大量研究学者采用神经网络构建分类模型进行目标分类。
神经网络可包括卷积神经网络以及残差神经网络(Residual Neural Network,ResNet)等。而现有的卷积神经网络以及残差神经网络由于其网络结构的固有性质,导致应用其构建的分类模型的训练精度和分类精度均无法保证,进而无法保证目标识别的效率和准确度。
因此现急需提供一种基于声波传播方程的双路耦合深度学习的目标分类方法,以解决上述问题。
发明内容
为克服上述问题或者至少部分地解决上述问题,本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法。
第一方面,本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法,包括:
获取待分类目标的原始图片;
将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
优选地,所述输入变量为振动速度变量,所述伴随输入变量为声波压力变量;或者,
所述输入变量为声波压力变量,所述伴随输入变量为振动速度变量。
优选地,所述隐藏层包括至少一个阶段组,所述阶段组中包括四个阶段,每个阶段均包括压力卷积单元和速度卷积单元,相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接,前一阶段的速度卷积单元与后一阶段的压力卷积单元连接;
对于除所述隐藏层中与所述输入部分连接的阶段组中的第一阶段、第二阶段以及所述隐藏层中与所述输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段,所述阶段中压力卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中压力卷积单元的输入与所述阶段的前一阶段中速度卷积单元的输出的相加结果,所述阶段中压力卷积单元的输出与所述阶段的前一阶段中速度卷积单元的输入的相加结果作为所述阶段的后一阶段中速度卷积单元的输入;所述阶段中速度卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中速度卷积单元的输入与所述阶段的前一阶段中压力卷积单元的输出的相加结果,所述阶段中速度卷积单元的输出与所述阶段的前一阶段中压力卷积单元的输入的相加结果作为所述阶段的后一阶段中压力卷积单元的输入;
所述第一阶段中压力卷积单元的输入为所述振动速度变量经所述输入部分后的输出结果,所述第一阶段中压力卷积单元的输出与第一预设矩阵的相加结果作为所述第二阶段中速度卷积单元的输入;所述第一阶段中速度卷积单元的输入为所述声波压力变量经所述输入部分后的输出结果,所述第一阶段中速度卷积单元的输出与第二预设矩阵的相加结果作为所述第二阶段中压力卷积单元的输入;所述第四阶段中压力卷积单元的输出或所述第四阶段中速度卷积单元的输出与所述输出部分连接。
优选地,每个压力卷积单元和每个速度卷积单元中均包括两个滤波器,每个滤波器中包括预设数量个卷积核;
每个压力卷积单元和每个速度卷积单元中的两个滤波器之间通过激活层实现连接。
优选地,所述隐藏层的数据结构具体为:
其中,j为所述隐藏层中所有阶段中的第j阶段,3≤j+2≤K,K为所述隐藏层中所有阶段的数量,pj+2为第j+2阶段中压力卷积单元的输入,pj为第j阶段中压力卷积单元的输入,vj+1为第j+1阶段中速度卷积单元的输入,为第j+1阶段中压力卷积单元中第一个滤波器的传递函数,为第j+1阶段中压力卷积单元中第二个滤波器的传递函数,σj+1为第j+1阶段中压力卷积单元以及速度卷积单元中激活层的激活函数,vj+2为第j+2阶段中速度卷积单元的输入,vj为第j阶段中速度卷积单元的输入,pj+1为第j+1阶段中压力卷积单元的输入,为第j+1阶段中速度卷积单元中第一个滤波器的传递函数,为第j+1阶段中速度卷积单元中第二个滤波器的传递函数。
优选地,所述跨层跳跃连接结构中包括卷积层和多个归一化层。
优选地,所述输出部分包括:池化层、全连接层、softmax层和分类层。
第二方面,本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类系统,包括:
图片获取模块,用于获取待分类目标的原始图片;
类别确定模块,用于将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
第三方面,本发明实施例提供了一种电子设备,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行第一方面提供的基于声波传播方程的双路耦合深度学习的目标分类方法。
第四方面,本发明实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面提供的基于声波传播方程的双路耦合深度学习的目标分类方法。
本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法,采用预设深度神经网络分类模型确定出待分类目标所属的类别,由于隐藏层具有两路耦合结构和跨层跳跃连接结构,可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力,可以克服“梯度消失”的问题,使SWTNN分类模型的训练精度和分类精度得到提高,进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且,本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的,具有明确的物理和数学意义,是一种可解释的深度神经网络分类模型,这是另一个重要技术突破,具有很强的创新性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法的流程示意图;
图2为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类方法中SWTNN分类模型的结构示意图;
图3为本发明实施例提供的一种SWTNN分类模型中隐藏层的结构示意图;
图4为本发明实施例提供的一种SWTNN分类模型中隐藏层的结构示意图;
图5为本发明实施例提供的一种SWTNN分类模型中隐藏层中的一个压力卷积单元的结构示意图;
图6为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图;
图7为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图;
图8为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图;
图9为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图;
图10为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图;
图11为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图;
图12为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图;
图13为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图;
图14为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图;
图15为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图;
图16为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图;
图17为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图;
图18为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图;
图19为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图;
图20为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图;
图21为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图;
图22为本发明实施例提供的一种基于声波传播方程的双路耦合深度学习的目标分类系统的结构示意图;
图23为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种基于声波传播方程的双路耦合深度学习的目标分类方法,包括:
S1,获取待分类目标的原始图片;
S2,将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
具体地,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,首先获取到待分类目标的原始图片,其中待分类目标可以是猫、狗等动物,还可以是花、草、树等植物,也可以是不同类别的农作物,只要是需要进行分类的目标均可以作为本申请的待分类目标。
本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法是基于预设深度神经网络分类模型实现对原始图片中的待分类目标进行分类的,具体是将原始图片输入至预设深度神经网络分类模型中,由预设深度神经网络分类模型输出待分类目标所属的类别。原始图片的输入方式可以是将原始图片的像素矩阵输入至预设深度神经网络分类模型中。原始图片的像素矩阵是指原始图片中各像素点的取值形成的矩阵,像素矩阵中元素与原始图片中像素点一一对应。
本发明实施例中采用的预设深度神经网络分类模型是基于频率域一阶声波传播方程和有限差分算法构建,并基于包含有所属类别已知的目标样本的图片样本训练得到。
首先,利用频率域一阶声波传播方程,得到振动速度与声波压力之间的关系;
然后,利用有限差分方法中心差分格式,建立预设深度神经网络分类模型的传播函数,预设深度神经网络分类模型中含有振动速度、声波压力两条更新路径,且具有两路耦合结构和跨层跳跃连接结构,使预设深度神经网络分类模型具有更高的训练精度以及分类精度。
介质中时间域一阶声波传播方程可以通过公式(1)表示:
其中,r表示介质中物质质点的空间坐标,p(r,t)表示t时刻r处的声波压力,v(r,t)表示t时刻r处的物质质点的振动速度,ρ(r)表示r处的介质密度,c(r)表示r处的介质中声波传播速度,为常数,为空间梯度算子。
时间域一阶声波传播方程描述了介质中压力的传播,它与介质密度和刚度有关。当压力通过介质时,质量粒子在局部位置振动。
通过傅里叶变换,可以将公式(1)中表示的一阶声波传播方程转换为频率域一阶声波传播方程,如公式(2)所示:
其中,ω为经傅里叶变换得到的频率。
本发明实施例中提供的有限差分(Finite Difference,FD)算法是一种求偏微分(或常微分)方程和方程组定解问题的数值解的方法,有限差分算法可包括中心差分格式,公式(2)中的空间梯度算子通过中心差分格式表示为公式(3)的形式来近似计算。
其中,vj+2为第j+2个振动速度值,vj+1为第j+1个振动速度值,vj为第j个振动速度值,Uj+1=-2Δx·iω/ρc2为第j+1个速度差分系数,pj+2为第j+2个声波压力值,pj为第j个声波压力值,Wj+1=-2Δx·iωρ为第j+1个压力差分系数,Δx为vj+2与vj的横坐标x的差值以及pj+2与pj的横坐标x的差值,3≤j+2≤M,M为中心差分格式中的差分数量。
从公式(3)可知,利用振动速度值vj+1和声波压力值pj可以更新声波压力值pj+2,因此,本发明实施例中可以将公式(3)作为预设深度神经网络分类模型的传播函数,声波通过介质的传输过程可以等效为声波从预设深度神经网络分类模型的输入部分传输至输出部分的行为。因此,本发明实施例中采用的预设深度神经网络分类模型实际上是一种声波传播方程神经网络(Sound Wave Travel Neural Network,SWTNN)分类模型。
如图2所示,本发明实施例中SWTNN分类模型包括:输入部分21、隐藏层22和输出部分23,输入部分21、隐藏层22和输出部分23依次连接,输入部分设置有输入变量和伴随输入变量,既可以将声波压力作为输入变量,也可以将振动速度作为输入变量。本发明实施例中提供的SWTNN分类模型,无论是将声波压力还是振动速度作为输入变量,均不会影响SWTNN分类模型的应用。SWTNN分类模型在应用时,将原始图片作为输入变量输入至SWTNN分类模型后,SWTNN分类模型即可输出原始图片中待分类目标所属的类别。
本发明实施例中提供的SWTNN分类模型中,隐藏层具有两路耦合结构和跨层跳跃连接结构,两路耦合结构是指分两路同时对输入变量和伴随输入变量进行处理,两路即相互独立又在处理过程中实现两路交叉耦合,即与输入变量对应的一路既处理输入变量还处理伴随输入变量,与伴随输入变量对应的一路也既处理伴随输入变量还处理输入变量。跨层跳跃连接结构是指对于每一路来说,在隐藏层的多层结构中每隔一层实现一次连接。
对预设深度神经网络分类模型的训练过程可等价于给定输入部分和输出部分的数据,求解一个波动方程参数的优化反演问题。将输入变量视为引起输出部分的质点共振的振动源,用声波方程的数值算法解释预设深度神经网络分类模型的输入-输出之间的关系更加易于理解。基于包含有所属类别已知的目标样本的图片样本训练得到。
预设深度神经网络分类模型的训练可通过如下流程体现:
1)确定包含有所属类别已知的目标样本的图片样本,将图片样本作为预设深度神经网络分类模型的输入,将目标样本的所属类别作为预设深度神经网络分类模型的输出,对预设深度神经网络分类模型进行训练,训练过程相当于估计声波传播路径上(即预设深度神经网络分类模型的隐含层内部)的“密度”和“刚度”;
2)通过调整预设深度神经网络分类模型中隐含层内各阶段的权重,可以得到由输入部分的输入变量引起的输出部分的期望数值,这是一个定义明确的物理问题;
3)通过中心差分格式求解方程,得到了一个声波传播方程神经网络算法,通过调整有限差分系数,可以得到输出部分的期望值。
在训练过程中,将图片样本中的80%作为训练集进行上述训练,然后将图片样本中的20%作为评估集对经上述训练后得到的预设深度神经网络分类模型进行评估,根据评估结果决定是否需要进一步训练。
本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,采用预设深度神经网络分类模型确定出待分类目标所属的类别,由于隐藏层具有两路耦合结构和跨层跳跃连接结构,可以使SWTNN分类模型同时具有双路耦合能力和各层之间的跳跃连接能力,可以克服“梯度消失”的问题,使SWTNN分类模型的训练精度和分类精度得到提高,进而使确定出待分类目标所属类别的效率和准确率均大大提高。而且,本发明实施例中采用的SWTNN分类模型是基于频率域一阶声波传播方程和有限差分算法构建的,具有明确的物理和数学意义,是一种可解释的深度神经网络分类模型,这是另一个重要技术突破,具有很强的创新性。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,输入部分还可以包括激活层和多个归一化层,用以对输入变量进行处理,以使处理后的输入变量符合隐藏层的输入要求。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,所述输入变量为振动速度变量,所述伴随输入变量为声波压力变量;或者,所述输入变量为声波压力变量,所述伴随输入变量为振动速度变量。
具体地,本发明实施例中可以采用“压力边界条件”,即声波压力为输入变量,振动速度为伴随输入变量,将原始图片作为声波压力变量输入,将振动速度设置为0。本发明实施例中还可以采用“速度边界条件”,即振动速度为输入变量,声波压力为伴随输入变量,将原始图片作为振动速度变量输入,声波压力设置为0。
本发明实施例中振动速度是与声波压力耦合的伴随特征,具有额外的物理意义。声波压力是对物质质点处由质量膨胀和收缩引起的应变的测量。而振动速度则描述了物质质点的运动速度。通过引入伴随变量,将互补信息集成到预设深度神经网络分类模型中,防止了SWTNN分类模型中梯度的消失。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,隐藏层包括至少一个阶段组,所述阶段组中包括四个阶段,每个阶段均包括压力卷积单元和速度卷积单元,相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接,前一阶段的速度卷积单元与后一阶段的压力卷积单元连接。
对于除所述隐藏层中与所述输入部分连接的阶段组中的第一阶段、第二阶段以及所述隐藏层中与所述输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段,所述阶段中压力卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中压力卷积单元的输入与所述阶段的前一阶段中速度卷积单元的输出的相加结果,所述阶段中压力卷积单元的输出与所述阶段的前一阶段中速度卷积单元的输入的相加结果作为所述阶段的后一阶段中速度卷积单元的输入;所述阶段中速度卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中速度卷积单元的输入与所述阶段的前一阶段中压力卷积单元的输出的相加结果,所述阶段中速度卷积单元的输出与所述阶段的前一阶段中压力卷积单元的输入的相加结果作为所述阶段的后一阶段中压力卷积单元的输入;
所述第一阶段中压力卷积单元的输入为所述速度输入变量经所述输入部分后的输出结果,所述第一阶段中压力卷积单元的输出与第一预设矩阵的相加结果作为所述第二阶段中速度卷积单元的输入;所述第一阶段中速度卷积单元的输入为所述压力输入变量经所述输入部分后的输出结果,所述第一阶段中速度卷积单元的输出与第二预设矩阵的相加结果作为所述第二阶段中压力卷积单元的输入;所述第四阶段中压力卷积单元的输出或所述阶段中速度卷积单元的输出与所述输出部分连接。
具体地,本发明实施例中的隐藏层是一个多层结构,将多层结构描述为多阶段结构,隐藏层具体包括至少一个阶段组,阶段组的个数可以根据需要进行设置,本发明实施例中对此不作具体限定。
每个阶段中均包括一个压力卷积单元和一个速度卷积单元,与声波压力对应的一路包括各阶段的压力神经元和压力卷积单元,与振动速度对应的一路包括各阶段的速度神经元和速度卷积单元。本发明实施例中压力卷积单元的输入可以用速度神经元表示,速度卷积单元的输入可以用压力神经元表示。
对于除隐藏层中与输入部分连接的阶段组中的第一阶段、第二阶段以及隐藏层中与输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段k(3≤k≤K,K为隐藏层中所有阶段的数量),阶段k中压力卷积单元的输入为阶段k前与阶段k间隔一个阶段的前二阶段(即阶段k-2)中压力卷积单元的输入与阶段k的前一阶段(即阶段k-1)中速度卷积单元的输出的相加结果,阶段k中压力卷积单元的输出与阶段k-1中速度卷积单元的输入的相加结果作为阶段k的后一阶段(即阶段k+1)中速度卷积单元的输入;阶段k中速度卷积单元的输入为阶段k-2中速度卷积单元的输入与阶段k-1中压力卷积单元的输出的相加结果,阶段k中速度卷积单元的输出与阶段k-1中压力卷积单元的输入的相加结果作为阶段k+1中压力卷积单元的输入。
对于除隐藏层中的第一阶段中压力卷积单元w1的输入v1为振动速度变量经输入部分后的输出结果,第一阶段中压力卷积单元w1的输出与第一预设矩阵A的相加结果作为第二阶段中速度卷积单元u2的输入p2;第一阶段中速度卷积单元u1的输入p1为声波压力变量经输入部分后的输出结果,第一阶段中速度卷积单元u1的输出与第二预设矩阵B的相加结果作为第二阶段中压力卷积单元w2的输入v2;第四阶段中压力卷积单元wK的输出或第四阶段中速度卷积单元uK的输出与输出部分连接。其中,第一预设矩阵A与第二预设矩阵B可以根据需要进行设置。但是需要保证的是,第一预设矩阵A与第一阶段中压力卷积单元w1的输出维度相同,第二预设矩阵B与第一阶段中速度卷积单元u1的输出维度相同。
如图3所示,为本发明实施例中提供的预设深度神经网络分类模型中隐藏层的结构示意图,图3中实线连接为两路耦合结构,虚线连接为跨层跳跃连接结构。图3中仅示出了其中一个阶段组,设该阶段组中的第一个阶段为整个隐藏层中的第j个阶段,该阶段组中的第二个阶段为整个隐藏层中的第j+1个阶段,该阶段组中的第三个阶段为整个隐藏层中的第j+2个阶段,该阶段组中的第四个阶段为整个隐藏层中的第j+3个阶段。其中,第j、j+1、j+2、j+3个阶段中的压力卷积单元分别用wj、wj+1、wj+2、wj+3表示,压力神经元分别用pj、pj+1、pj+2、pj+3、pj+4表示。第j、j+1、j+2、j+3个阶段中的速度卷积单元分别用uj、uj+1、uj+2、uj+3表示,速度神经元分别用vj、vj+1、vj+2、vj+3、vj+4表示。wj、uj+1、wj+2、uj+3通过神经元pj+1、vj+2、pj+3依次连接,uj、wj+1、uj+2、wj+3通过神经元vj+1、pj+2、vj+3依次连接。其中,wj、wj+1、wj+2、wj+3分别表示对应的压力卷积单元的传递函数,也即对应的压力卷积单元两端连接的神经元的连接权重,即分别对应于公式(3)中的压力差分系数,uj、uj+1、uj+2、uj+3分别表示对应的速度卷积单元的传递函数,也即对应的速度卷积单元两端连接的神经元的连接权重,即分别对应于公式(3)中的速度差分系数。
以图3中第j+2个阶段为例,第j+2个阶段中压力卷积单元wj+2的输入为速度神经元vj+2,vj+2具体为第j个阶段中压力卷积单元wj的输入vj与第j个阶段中速度卷积单元uj的输出的相加结果,第j+2个阶段中压力卷积单元wj+2的输出与第j+1个阶段中速度卷积单元uj+1的输入pj+1的相加结果作为第j+3个阶段中速度卷积单元uj+3的输入pj+3;第j+2个阶段中速度卷积单元uj+2的输入pj+2为第j个阶段中速度卷积单元uj的输入pj与第j+1个阶段中压力卷积单元wj+1的输出的相加结果,第j+2个阶段中速度卷积单元uj+2的输出与第j+1个阶段中压力卷积单元wj+1的输入vj+1的相加结果作为第j+3个阶段中压力卷积单元wj+3的输入vj+3。
以声波压力作为输入变量时,输出部分的输入由声波压力对应的一路的输出确定,即为隐藏层中的最后一个压力神经元pK。以振动速度作为输入变量时,输出部分的输入则由振动速度对应的一路的输出确定,即为隐藏层中的最后一个速度神经元vK。
若隐藏层中仅具有一个阶段组,阶段组中包括4个阶段,则隐藏层的结构如图4所示,图4中以声波压力作为输入变量,对应的伴随输入变量为振动速度,设置为0。隐藏层中第1、2、3、4个阶段中的压力卷积单元分别用w1、w2、w3、w4表示,压力神经元分别用p1、p2、p3、p4、p5表示。第1、2、3、4个阶段中的速度卷积单元分别用u1、u2、u3、u4表示,速度神经元分别用v1、v2、v3、v4、v5表示。输出部分的输入为隐藏层中的最后一个压力神经元p5。当以振动速度作为输入变量,对应的伴随输入变量为声波压力,设置为0。输出部分的输入为隐藏层中的最后一个压力神经元v5。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,每个压力卷积单元和每个速度卷积单元中均包括两个滤波器,每个滤波器中包括预设数量个卷积核;
每个压力卷积单元和每个速度卷积单元中的两个滤波器之间通过激活层实现连接。
具体地,如图5所示,为一个压力卷积单元5的结构示意图,图5中包括第一滤波器51和第二滤波器52,第一滤波器51和第二滤波器52之间通过激活层53实现连接。需要说明的是,本发明实施例中每个压力卷积单元和每个速度卷积单元中的两个滤波器均是相同的,均是由N个卷积核构成,实现N次卷积,即在一个压力卷积单元和一个速度卷积单元中先进行N次卷积,然后再通过激活层进行激活,最后再进行N次卷积输出。N的具体取值可以根据需要进行设置,例如3、4、7、8等。
需要说明的是,N是一个控制参数,表征预设深度神经网络分类模型的网络深度。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,所述隐藏层的数据结构具体为:
其中,j为所述隐藏层中所有阶段中的第j阶段,3≤j+2≤K,K为所述隐藏层中所有阶段的数量,pj+2为第j+2阶段中压力卷积单元的输入,pj为第j阶段中压力卷积单元的输入,vj+1为第j+1阶段中速度卷积单元的输入,为第j+1阶段中压力卷积单元中第一个滤波器的传递函数,为第j+1阶段中压力卷积单元中第二个滤波器的传递函数,σj+1为第j+1阶段中压力卷积单元以及速度卷积单元中激活层的激活函数,vj+2为第j+2阶段中速度卷积单元的输入,vj为第j阶段中速度卷积单元的输入,pj+1为第j+1阶段中压力卷积单元的输入,为第j+1阶段中速度卷积单元中第一个滤波器的传递函数,为第j+1阶段中速度卷积单元中第二个滤波器的传递函数。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,所述跨层跳跃连接结构中包括卷积层和多个归一化层。
具体地,本发明实施例中提供的跨层跳跃连接结构中包括卷积层和多个归一化层,即在图3中的虚线上设置一个卷积层和多个归一化层,用以使第j+2个阶段中压力卷积单元wj+2的输出与第j+1个阶段中速度卷积单元uj+1的输入pj+1进行相加之前,将第j+1个阶段中速度卷积单元uj+1的输入pj+1进行一次卷积以及多次归一化处理,保证处理后的pj+1与wj+2的输出顺利实现相加。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,所述输出部分包括:池化层、全连接层、softmax层和分类层。
池化层、全连接层、softmax层和分类层依次连接,最后由分类层输出待分类目标所属的类别。
在上述实施例的基础上,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,以SWTNN分类模型的隐藏层包括一个阶段组为例,隐藏层的结构如图4所示,其中SWTNN分类模型的网络深度N的取值分别为3、4、7、8。第1、2、3、4个阶段中的压力卷积单元和速度卷积单元中的滤波器的特征尺寸分别为32×32、16×16、8×8和4×4,即第1个阶段中各滤波器中的卷积核的尺寸为32×32,第2个阶段中各滤波器中的卷积核的尺寸为16×16,第3个阶段中各滤波器中的卷积核的尺寸为8×8,第4个阶段中各滤波器中的卷积核的尺寸为4×4。跨层跳跃连接结构中的卷积层中卷积核的尺寸为1×1。同时,构建一个三级ResNet,ResNet的网络深度的取值分别为3、4、7、8。卷积层的特征尺寸分别为32×32、16×16和8×8。分别使用CIFAR-10、CIFAR-100的图像数据集对本发明实施例中SWTNN分类模型以及现有技术中的ResNet的训练精度以及分类精度(以下均用评估精度表示)进行评估。
如图6所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图,如图7所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图。图7中直线为1:1线,从图7中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练精度高于现有技术中的ResNet的训练精度。如图8所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图,如图9所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图。图9中直线为1:1线,从图9中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估精度高于现有技术中的ResNet的评估精度。
如图10所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图,如图11所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图。图11中直线为1:1线,从图11中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练损失高于现有技术中的ResNet的训练损失。如图12所示为CIFAR-10的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图,如图13所示为CIFAR-10的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图。图13中直线为1:1线,从图13中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估损失在最后阶段低于现有技术中的ResNet的评估损失。
如图14所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练精度随训练迭代次数的变化示意图,如图15所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练精度与现有技术中的ResNet的训练精度对比图。图15中直线为1:1线,从图15中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练精度高于现有技术中的ResNet的训练精度。如图16所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估精度随训练迭代次数的变化示意图,如图17所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估精度与现有技术中的ResNet的评估精度对比图。图17中直线为1:1线,从图17中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估精度高于现有技术中的ResNet的评估精度。
如图18所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的训练损失随训练迭代次数的变化示意图,如图19所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的训练损失与现有技术中的ResNet的训练损失对比图。图19中直线为1:1线,从图19中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的训练损失高于现有技术中的ResNet的训练损失。如图20所示为CIFAR-100的图像数据集对应的本发明实施例中SWTNN分类模型的评估损失随训练迭代次数的变化示意图,如图21所示为CIFAR-100的图像数据集对应的本发明实施例中的SWTNN分类模型的评估损失与现有技术中的ResNet的评估损失对比图。图21中直线为1:1线,从图21中可以看出,在1:1线上方的数据点均表示本发明实施例中的SWTNN分类模型的评估损失在最后阶段低于现有技术中的ResNet的评估损失。
本发明实施例中图6-图21中的SWTNN3-SWTNN8表示SWTNN分类模型中N=3-8时对应的曲线,ResNet3-ResNet8表示ResNet中N=3-8时对应的曲线。
由于原始的训练精度曲线以及评估精度曲线的波动较大,因此为了便于比较,分别对原始的训练精度曲线以及评估精度曲线进行了窗长501的平滑处理,得到如图6、8、10、12、14、16、18、20示出的曲线。
从图6、图8、图14、图16中可以知晓,SWTNN分类模型的训练精度以及评估精度均随训练迭代次数的增加而增加。从图10、图12、图18、图20中可以知晓,SWTNN分类模型的训练损失以及评估损失均随训练迭代次数的增加而减少。
如图7和图9所示,当训练精度和评估精度分别达到95%左右时,SWTNN分类模型与ResNet的训练精度比值以及评估精度比值均超过1:1,说明SWTNN分类模型的训练精度高于的ResNet训练精度,SWTNN分类模型的评估精度高于ResNet的评估精度。
当网络深度从N=3增加到N=8时,如表1所示,CIFAR-10的图像数据集对应的ResNet的评估精度为88.76%-88.78%,可以发现ResNet在评估精度上性能提升难以区分,而SWTNN分类模型的分类准确率从90.38%明显提高到91.82%。如表2所示,CIFAR-100的图像数据集对应的ResNet的评估精度从72.72%下降至71.59%,而SWTNN分类模型的分类准确率从74.86%明显提高到78.31%。有趣的是,在训练过程中,如图6所示,SWTNN分类模型的训练精度并不总是优于ResNet的训练精度。当训练和评估精度低于80%时,SWTNN分类模型与ResNet的数据点大多在1:1线以下。随着训练步骤的进行,数据点跳到了1:1线以上。SWTNN分类模型的训练精度在训练运行的后期超过了ResNet。
表1 CIFAR-10的图像数据集下SWTNN分类模型与ResNet的参数比较表
N | 训练精度 | 评估精度 | 训练损失 | 评估损失 |
SWTNN3 | 98.02% | 90.38% | 0.063 | 0.311 |
SWTNN4 | 98.44% | 91.32% | 0.044 | 0.290 |
SWTNN7 | 98.74% | 91.73% | 0.035 | 0.275 |
SWTNN8 | 99.06% | 91.82% | 0.022 | 0.281 |
ResNet3 | 96.88% | 88.60% | 0.119 | 0.350 |
ResNet4 | 95.45% | 88.71% | 0.135 | 0.344 |
ResNet7 | 95.57% | 89.00% | 0.137 | 0.342 |
ResNet8 | 95.33% | 88.96% | 0.134 | 0.343 |
表2 CIFAR-100的图像数据集下SWTNN分类模型与ResNet的参数比较表
N | 训练精度 | 评估精度 | 训练损失 | 评估损失 |
SWTNN3 | 89.92% | 74.86% | 0.309 | 0.846 |
SWTNN4 | 92.19% | 76.98% | 0.241 | 0.771 |
SWTNN7 | 95.31% | 77.41% | 0.143 | 0.765 |
SWTNN8 | 95.56% | 78.31% | 0.135 | 0.747 |
ResNet3 | 83.59% | 72.33% | 0.535 | 0.895 |
ResNet4 | 88.28% | 72.61% | 0.441 | 0.872 |
ResNet7 | 83.59% | 73.51% | 0.512 | 0.860 |
ResNet8 | 82.41% | 72.27% | 0.539 | 0.892 |
通过CIFAR-100的图像数据集对SWTNN分类模型和ResNet进行评估时可以发现,从训练精度和评估精度曲线可以得出与通过CIFAR-10的图像数据集评估时相同的结论。CIFAR-100结果的一个小差异是,SWTNN分类模型与ResNet的数据点在更大的范围(从50%开始)远高于1:1线,对于CIFAR-100的图像数据集来说,这意味着SWTNN分类模型的准确性比ResNet好得多。
本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类方法,基于具有明确意义的物理过程和数值计算方法,构建了含两路耦合结构和跨层跳跃连接结构的预设深度神经网络分类模型,引入伴随输入变量后预设深度神经网络分类模型的训练精度和评估精度都得到很大提高。该技术的重要创新之处在于突破了传统单变量传播的网络模型,在预设深度神经网络分类模型中引入了两个变量更新途径相互耦合机制,大大改善了预设深度神经网络分类模型“梯度消失”问题,具有很强的创新性。
如图22所示,在上述实施例的基础上,本发明实施例中提供了一种基于声波传播方程的双路耦合深度学习的目标分类系统,包括:图片获取模块221和类别确定模块222。其中,
图片获取模块221用于获取待分类目标的原始图片;
类别确定模块222用于将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
具体地,本发明实施例中提供的基于声波传播方程的双路耦合深度学习的目标分类系统中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,本发明实施例中对此不再赘述。
图23所示,在上述实施例的基础上,本发明实施例中提供了一种电子设备,包括:处理器(processor)2301、存储器(memory)2302、通信接口(Communications Interface)2303和总线2304;其中,
所述处理器2301、存储器2302、通信接口2303通过总线2304完成相互间的通信。所述存储器2302存储有可被所述处理器2301执行的程序指令,处理器2301用于调用存储器2302中的程序指令,以执行上述各方法实施例所提供的方法。
存储器2302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在上述实施例的基础上,本发明实施例中提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,包括:
获取待分类目标的原始图片;
将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
2.根据权利要求1所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,所述输入变量为振动速度变量,所述伴随输入变量为声波压力变量;或者,
所述输入变量为声波压力变量,所述伴随输入变量为振动速度变量。
3.根据权利要求2所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,所述隐藏层包括至少一个阶段组,所述阶段组中包括四个阶段,每个阶段均包括压力卷积单元和速度卷积单元,相邻两个阶段中前一阶段的压力卷积单元与后一阶段的速度卷积单元连接,前一阶段的速度卷积单元与后一阶段的压力卷积单元连接;
对于除所述隐藏层中与所述输入部分连接的阶段组中的第一阶段、第二阶段以及所述隐藏层中与所述输出部分连接的阶段组中的第四阶段外的所有阶段组中的每一阶段,所述阶段中压力卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中压力卷积单元的输入与所述阶段的前一阶段中速度卷积单元的输出的相加结果,所述阶段中压力卷积单元的输出与所述阶段的前一阶段中速度卷积单元的输入的相加结果作为所述阶段的后一阶段中速度卷积单元的输入;所述阶段中速度卷积单元的输入为所述阶段前与所述阶段间隔一个阶段的前二阶段中速度卷积单元的输入与所述阶段的前一阶段中压力卷积单元的输出的相加结果,所述阶段中速度卷积单元的输出与所述阶段的前一阶段中压力卷积单元的输入的相加结果作为所述阶段的后一阶段中压力卷积单元的输入;
所述第一阶段中压力卷积单元的输入为所述振动速度变量经所述输入部分后的输出结果,所述第一阶段中压力卷积单元的输出与第一预设矩阵的相加结果作为所述第二阶段中速度卷积单元的输入;所述第一阶段中速度卷积单元的输入为所述声波压力变量经所述输入部分后的输出结果,所述第一阶段中速度卷积单元的输出与第二预设矩阵的相加结果作为所述第二阶段中压力卷积单元的输入;所述第四阶段中压力卷积单元的输出或所述第四阶段中速度卷积单元的输出与所述输出部分连接。
4.根据权利要求3所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,每个压力卷积单元和每个速度卷积单元中均包括两个滤波器,每个滤波器中包括预设数量个卷积核;
每个压力卷积单元和每个速度卷积单元中的两个滤波器之间通过激活层实现连接。
5.根据权利要求4所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,所述隐藏层的数据结构具体为:
其中,j为所述隐藏层中所有阶段中的第j阶段,3≤j+2≤K,K为所述隐藏层中所有阶段的数量,pj+2为第j+2阶段中压力卷积单元的输入,pj为第j阶段中压力卷积单元的输入,vj+1为第j+1阶段中速度卷积单元的输入,为第j+1阶段中压力卷积单元中第一个滤波器的传递函数,为第j+1阶段中压力卷积单元中第二个滤波器的传递函数,σj+1为第j+1阶段中压力卷积单元以及速度卷积单元中激活层的激活函数,vj+2为第j+2阶段中速度卷积单元的输入,vj为第j阶段中速度卷积单元的输入,pj+1为第j+1阶段中压力卷积单元的输入,为第j+1阶段中速度卷积单元中第一个滤波器的传递函数,为第j+1阶段中速度卷积单元中第二个滤波器的传递函数。
6.根据权利要求1-5中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,所述跨层跳跃连接结构中包括卷积层和多个归一化层。
7.根据权利要求1-5中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法,其特征在于,所述输出部分包括:池化层、全连接层、softmax层和分类层。
8.一种基于声波传播方程的双路耦合深度学习的目标分类系统,其特征在于,包括:
图片获取模块,用于获取待分类目标的原始图片;
类别确定模块,用于将所述原始图片输入至预设深度神经网络分类模型中,由所述预设深度神经网络分类模型输出所述待分类目标所属的类别;
其中,所述预设深度神经网络分类模型基于频率域一阶声波传播方程和有限差分算法构建;所述预设深度神经网络分类模型包括:输入部分、隐藏层和输出部分,所述输入部分、所述隐藏层和所述输出部分依次连接,所述输入部分设置有输入变量和伴随输入变量,所述隐藏层具有两路耦合结构和跨层跳跃连接结构。
9.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行如权利要求1-7中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1-7中任一项所述的基于声波传播方程的双路耦合深度学习的目标分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/112743 WO2020258615A1 (zh) | 2019-06-19 | 2019-10-23 | 基于声波传播方程的双路耦合深度学习的目标分类方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910531852 | 2019-06-19 | ||
CN2019105318526 | 2019-06-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110288020A true CN110288020A (zh) | 2019-09-27 |
CN110288020B CN110288020B (zh) | 2021-05-14 |
Family
ID=68005772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910556032.2A Active CN110288020B (zh) | 2019-06-19 | 2019-06-25 | 基于声波传播方程的双路耦合深度学习的目标分类方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110288020B (zh) |
WO (1) | WO2020258615A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020258615A1 (zh) * | 2019-06-19 | 2020-12-30 | 清华大学 | 基于声波传播方程的双路耦合深度学习的目标分类方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887137B (zh) * | 2021-10-08 | 2024-11-26 | 中国人民解放军海军工程大学 | 基于融合式神经网络的多磁性材料参数反演方法及系统 |
CN116032704A (zh) * | 2021-10-27 | 2023-04-28 | 上海诺基亚贝尔股份有限公司 | 一种基于储备池计算的方法、装置、设备及信号均衡器 |
CN118312862B (zh) * | 2024-06-06 | 2024-10-11 | 广汽埃安新能源汽车股份有限公司 | 一种汽车能耗预测方法、装置、存储介质及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106297297A (zh) * | 2016-11-03 | 2017-01-04 | 成都通甲优博科技有限责任公司 | 基于深度学习的交通拥堵判别方法 |
CN108537193A (zh) * | 2018-04-17 | 2018-09-14 | 厦门美图之家科技有限公司 | 一种人脸属性中的种族属性识别方法及移动终端 |
CN109522938A (zh) * | 2018-10-26 | 2019-03-26 | 华南理工大学 | 一种基于深度学习的图像中目标的识别方法 |
US20190138849A1 (en) * | 2017-11-08 | 2019-05-09 | Bae Systems Information And Electronic Systems Integration Inc. | Rotation variant object detection in deep learning |
CN109753878A (zh) * | 2018-12-06 | 2019-05-14 | 北京科技大学 | 一种恶劣天气下的成像识别方法及系统 |
US20190147245A1 (en) * | 2017-11-14 | 2019-05-16 | Nuro, Inc. | Three-dimensional object detection for autonomous robotic systems using image proposals |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180060728A1 (en) * | 2016-08-31 | 2018-03-01 | Microsoft Technology Licensing, Llc | Deep Embedding Forest: Forest-based Serving with Deep Embedding Features |
CN108764009A (zh) * | 2018-03-21 | 2018-11-06 | 苏州大学 | 基于深度残差长短时记忆网络的视频事件识别方法 |
CN109447184A (zh) * | 2018-11-28 | 2019-03-08 | 南京理工大学 | 基于深度学习的Android应用网络行为分类方法及系统 |
CN109740673A (zh) * | 2019-01-02 | 2019-05-10 | 天津工业大学 | 一种融合暗通道的神经网络烟雾图像分类方法 |
CN110288020B (zh) * | 2019-06-19 | 2021-05-14 | 清华大学 | 基于声波传播方程的双路耦合深度学习的目标分类方法 |
-
2019
- 2019-06-25 CN CN201910556032.2A patent/CN110288020B/zh active Active
- 2019-10-23 WO PCT/CN2019/112743 patent/WO2020258615A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106297297A (zh) * | 2016-11-03 | 2017-01-04 | 成都通甲优博科技有限责任公司 | 基于深度学习的交通拥堵判别方法 |
US20190138849A1 (en) * | 2017-11-08 | 2019-05-09 | Bae Systems Information And Electronic Systems Integration Inc. | Rotation variant object detection in deep learning |
US20190147245A1 (en) * | 2017-11-14 | 2019-05-16 | Nuro, Inc. | Three-dimensional object detection for autonomous robotic systems using image proposals |
CN108537193A (zh) * | 2018-04-17 | 2018-09-14 | 厦门美图之家科技有限公司 | 一种人脸属性中的种族属性识别方法及移动终端 |
CN109522938A (zh) * | 2018-10-26 | 2019-03-26 | 华南理工大学 | 一种基于深度学习的图像中目标的识别方法 |
CN109753878A (zh) * | 2018-12-06 | 2019-05-14 | 北京科技大学 | 一种恶劣天气下的成像识别方法及系统 |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
Non-Patent Citations (2)
Title |
---|
BO ZHAO等: "《A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation》", 《INTERNATIONAL JOURNAL OF AUTOMATION AND COMPUTING》 * |
孙卫涛 等: ""波动方程反演的全局优化方法研究"", 《地球物理学进展》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020258615A1 (zh) * | 2019-06-19 | 2020-12-30 | 清华大学 | 基于声波传播方程的双路耦合深度学习的目标分类方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2020258615A1 (zh) | 2020-12-30 |
CN110288020B (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110288020B (zh) | 基于声波传播方程的双路耦合深度学习的目标分类方法 | |
CN110880036B (zh) | 神经网络压缩方法、装置、计算机设备及存储介质 | |
US20240273336A1 (en) | Neural Architecture Search with Factorized Hierarchical Search Space | |
CN108416755B (zh) | 一种基于深度学习的图像去噪方法及系统 | |
CN108170736B (zh) | 一种基于循环注意力机制的文档快速扫描定性方法 | |
CN107273936B (zh) | 一种gan图像处理方法及系统 | |
US20190340510A1 (en) | Sparsifying neural network models | |
JP6831347B2 (ja) | 学習装置、学習方法および学習プログラム | |
CN104331442A (zh) | 视频分类方法和装置 | |
CN112784205B (zh) | 偏微分方程数据处理方法、系统、存储介质、设备及应用 | |
CN109543029B (zh) | 基于卷积神经网络的文本分类方法、装置、介质和设备 | |
KR102250728B1 (ko) | 샘플 처리 방법, 장치, 기기 및 저장 매체 | |
CN107832787A (zh) | 基于双谱自编码特征的雷达辐射源识别方法 | |
JP7522936B2 (ja) | グラフニューラルネットワークに基づく遺伝子表現型予測 | |
JP7287397B2 (ja) | 情報処理方法、情報処理装置及び情報処理プログラム | |
JP6950756B2 (ja) | ニューラルネットワークのランク最適化装置および最適化方法 | |
CN110929854B (zh) | 一种数据处理方法、装置及硬件加速器 | |
WO2020003434A1 (ja) | 機械学習方法、機械学習装置、及び機械学習プログラム | |
CN109145107A (zh) | 基于卷积神经网络的主题提取方法、装置、介质和设备 | |
CN113538281B (zh) | 图像去噪方法、装置、计算机设备和存储介质 | |
CN105844332A (zh) | 快速递归Elman神经网络建模学习算法 | |
CN112307860A (zh) | 图像识别模型训练方法和装置、图像识别方法和装置 | |
CN112364989A (zh) | 一种基于快速傅里叶变换的卷积神经网络加速设计方法 | |
CN107743071B (zh) | 一种网络节点的增强表示方法及装置 | |
CN111565065B (zh) | 一种无人机基站部署方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |