CN114022354A - 图像处理方法、电子设备及计算机程序产品 - Google Patents
图像处理方法、电子设备及计算机程序产品 Download PDFInfo
- Publication number
- CN114022354A CN114022354A CN202111101722.2A CN202111101722A CN114022354A CN 114022354 A CN114022354 A CN 114022354A CN 202111101722 A CN202111101722 A CN 202111101722A CN 114022354 A CN114022354 A CN 114022354A
- Authority
- CN
- China
- Prior art keywords
- feature extraction
- image
- features
- output
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000004590 computer program Methods 0.000 title claims description 16
- 238000000605 extraction Methods 0.000 claims abstract description 280
- 238000013528 artificial neural network Methods 0.000 claims abstract description 111
- 238000000034 method Methods 0.000 claims abstract description 79
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims description 60
- 230000004927 fusion Effects 0.000 claims description 47
- 238000003860 storage Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 19
- 101100247599 Hordeum vulgare RCAB gene Proteins 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000011514 reflex Effects 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101150004367 Il4i1 gene Proteins 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种图像处理方法、装置及电子设备,该方法包括:获取待处理图像;通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像;其中,任意两个输出图像之间的相似度小于第一相似度;将多个输出图像进行融合,得到待处理图像对应的高频图像;其中,高频图像的分辨率高于待处理图像。基于对多个具有不同高频特征的输出图像得到的高频图像,可以有效提高高频图像的精度。
Description
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种图像处理方法、电子设备及计算机程序产品。
背景技术
超分辨率(SR,Super-Resolution)是给出一张低分辨率图像来恢复出一张高分辨率图像的视觉任务。近年来,CNN超分辨率逐渐取代了反向投影、稀疏表示和字典学习等传统方法,成为主流超分辨率方法。
因为一个低分辨率图像中的内容辨识度很低,可能应对很多甚至无穷的高分辨率的形态,因此,超分辨率是一个不适定(ill-posed)。传统的直入直出的单分支方法,对低分辨率图像直接进行学习,容易产生比较模糊的输出,有些基于GAN的方法将单分支网络加入了GAN loss想产生和高分辨率图像(HR,High-Resolution)相似的高频纹理,但是其本质还是只能获得单一高频特征的输出,并且生成的纹理不可控,导致输出的结果的精度不高。
发明内容
有鉴于此,本发明的目的在于提供一种图像处理方法、电子设备及计算机程序产品,以提高高频图像的精度。
第一方面,本发明实施例提供一种图像处理方法,该方法包括:获取待处理图像;通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像;其中,任意两个输出图像之间的相似度小于第一相似度;将多个输出图像进行融合,得到待处理图像对应的高频图像;其中,高频图像的分辨率高于待处理图像。
进一步地,上述多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的特征提取模块与下一层的至少一个特征提取模块连接,位于不同层的相互连接的特征提取模块构成多特征提取神经网络的一个通道;上述通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像的步骤,包括:通过多特征提取神经网络对待处理图像进行第一特征提取,得到初始特征;通过多特征提取神经网络的多个通道中的当前通道对初始特征进行第二特征提取,得到该通道对应的输出特征;其中,任意一个通道对应的输出特征的分辨率高于初始特征的分辨率;将每个通道的输出特征分别进行上采样处理,得到多个输出图像。
进一步地,上述通过多特征提取神经网络的多个通道中的当前通道对初始特征进行第二特征提取,得到该通道对应的输出特征的步骤,包括:通过当前特征提取模块对输入特征进行第二特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为通道中的第一个特征提取模块,则输入特征为初始特征,否则,输入特征为上一个特征提取模块的输出特征;将初始输出特征和当前特征提取模块对应的输入特征组合,作为当前特征提取模块的输出特征;判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行第二特征提取操作;如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的输出特征。
进一步地,上述将多个输出图像进行融合,得到待处理图像对应的高频图像的步骤,包括:通过融合网络确定每个输出图像的权重;将各个输出图像按照对应的权重进行加权求和,得到高频图像。
进一步地,上述多特征提取神经网络通过以下方式训练获得:获取样本图像及初始神经网络;其中,样本图像包括训练图像及其对应的标签图像,标签图像的分辨率高于训练图像的分辨率;对样本图像进行第三特征提取,得到训练图像对应的训练特征;通过初始神经网络对训练特征进行第四特征提取,得到多个预测特征;预测特征的分辨率高于训练特征的分辨率;根据预测特征确定预测特征对应的预测图像;根据预测图像及其对应的标签图像,确定总损失值;根据总损失值调整多特征提取神经网络的参数,直至满足第一训练停止条件。
进一步地,上述多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的特征提取模块与下一层的至少一个特征提取模块连接,位于不同层的相互连接的特征提取模块构成多特征提取神经网络的一个通道;上述通过多特征提取神经网络对训练特征进行第四特征提取,得到多个预测特征的步骤,包括:通过当前特征提取模块对输入特征进行第四特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为通道中的第一个特征提取模块,则输入特征为训练特征,否则,输入特征为上一个特征提取模块的输出特征;将初始输出特征与当前特征提取模块对应的输入特征组合,作为当前特征提取模块的输出特征;判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行第四特征提取操作;如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的预测特征。
进一步地,上述根据预测图像及其对应的标签图像,确定总损失值的步骤,包括:根据每个预测图像及标签图像,得到该预测图像对应的第一损失值;根据每两个预测图像及标签图像,得到该两个预测图像对应的第二损失值;根据第一损失值和第二损失值,确定总损失值。
进一步地,上述根据每两个预测图像及标签图像,得到该两个预测图像对应的第二损失值的步骤,包括:根据标签图像确定第一正样本,根据两个预测图像中的第一预测图像确定第一负样本,根据两个预测图像中的第二预测图像确定第一锚样本;通过第一正样本、第一负样本以及第一锚样本进行三元损失值计算,得到第一三元损失值;根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本;通过第二正样本、第二负样本以及第二锚样本进行三元损失值计算,得到第二三元损失值;将第一三元损失值与第二三元损失值相加,得到第二损失值。
进一步地,上述方法还包括:提取第一预测图像的第一灰度值和第二预测图像的第二灰度值;根据第一灰度值与标签图像确定第一残差;根据第二灰度值与标签图像确定第二残差;上述根据标签图像确定第一正样本,根据两个预测图像中的第一预测图像确定第一负样本,根据两个预测图像中的第二预测图像确定第一锚样本的步骤,包括:将第一残差确定为第一负样本;将第二残差确定为第一锚样本;上述根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本的步骤,包括:将第一残差确定为第二锚样本;将第二残差确定为第二负样本。
进一步地,上述多特征提取神经网络为M*N的树形拓扑结构,M代表多特征提取神经网络的层数,N代表多特征提取神经网络中的第一层包含的初始模块个数,第一层与多特征提取神经网络中的中间层中的每个初始模块均与下一层的N个初始模块连接。
进一步地,上述融合网络通过以下方法训练获得;获取初始融合网络;根据每个预测图像及其对应的初始权重,确定预测融合图像;根据预测融合图像和标签图像,确定第三损失值;根据第三损失值调整初始融合网络的参数,直至满足第二训练停止条件。
第二方面,本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面的图像处理方法。
第三方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面的图像处理方法。
第四方面,本发明实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现上述第一方面的图像处理方法。
本发明实施例提供的上述图像处理方法,首先获取待处理图像,通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像,再将多个输出图像进行融合,得到待处理图像对应的高频图像。由于多个具有不同高频特征的输出图像可以反映低频图像的不同方面的特征,因此,基于对多个具有不同高频特征的输出图像得到的高频图像,可以有效提高高频图像的精度。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种电子系统的结构示意图;
图2为本发明实施例提供的一种图像处理方法的流程图;
图3为本发明实施例提供的一种多特征提取神经网络的结构示意图;
图4为本发明实施例提供的一种多特征提取神经网络中的一个通道的结构及连接关系示意图;
图5为低频图像与通过本发明实施例提供的多特征提取神经网络的预测高频图像的对比示意图;
图6为本发明实施例提供的一种融合网络对四个输出图像进行融合的示意图;
图7为通过本发明实施例提供的一种图像处理方法得到的高频图像的示意图;
图8为本发明实施例提供的一种第一神经网络训练方法的流程图;
图9为本发明实施例提供的一种第二损失值的计算过程的示意图;
图10为通过不同图像处理方法得到的高频图像的对比示意图;
图11为通过不同图像处理方法的指标对比的示意图;
图12为本发明实施例提供的一种图像处理装置的示意图;
图13为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
近年来,基于人工智能的计算机视觉、深度学习、机器学习、图像处理、图像识别等技术研究取得了重要进展。人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸人的智能的理论、方法、技术及应用系统的新兴科学技术。人工智能学科是一门综合性学科,涉及芯片、大数据、云计算、物联网、分布式存储、深度学习、机器学习、神经网络等诸多技术种类。计算机视觉作为人工智能的一个重要分支,具体是让机器识别世界,计算机视觉技术通常包括人脸识别、活体检测、指纹识别与防伪验证、生物特征识别、人脸检测、行人检测、目标检测、行人识别、图像处理、图像识别、图像语义理解、图像检索、文字识别、视频处理、视频内容识别、行为识别、三维重建、虚拟现实、增强现实、同步定位与地图构建(SLAM)、计算摄影、机器人导航与定位等技术。随着人工智能技术的研究和进步,该项技术在众多领域展开了应用,例如安防、城市管理、交通管理、楼宇管理、园区管理、人脸通行、人脸考勤、物流管理、仓储管理、机器人、智能营销、计算摄影、手机影像、云服务、智能家居、穿戴设备、无人驾驶、自动驾驶、智能医疗、人脸支付、人脸解锁、指纹解锁、人证核验、智慧屏、智能电视、摄像机、移动互联网、网络直播、美颜、美妆、医疗美容、智能测温等领域。
目前的针对低频图像的图像处理方法往往是基于单输入图像进行高频预测,得到的高频图像精度较低,基于此,本发明实施例提供一种图像处理方法电子设备及计算机程序产品,以提高高频图像的精度。
参照图1所示的电子系统100的结构示意图。该电子系统可以用于实现本发明实施例的图像处理方法和装置。
如图1所示的一种电子系统的结构示意图,电子系统100包括一个或多个处理设备102、一个或多个存储装置104、输入装置106、输出装置108以及一个或多个图像采集设备110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子系统100的组件和结构只是示例性的,而非限制性的,根据需要,电子系统也可以具有其他组件和结构。
处理设备102可以为服务器、智能终端,或者是包含中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元的设备,可以对电子系统100中的其它组件的数据进行处理,还可以控制电子系统100中的其它组件以执行图像的处理功能。
存储装置104可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理设备102可以运行程序指令,以实现下文的本发明实施例中(由处理设备实现)的客户端功能以及/或者其它期望的功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据,例如应用程序使用和/或产生的各种数据等。
输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
输出装置108可以向外部(例如,用户)输出各种信息(例如,图像或声音),并且可以包括显示器、扬声器等中的一个或多个。
图像采集设备110可以获取待处理图像,并且将该待处理图像存储在存储装置104中以供其它组件使用。
示例性地,用于实现根据本发明实施例的图像处理方法、电子设备及计算机程序产品中的各器件可以集成设置,也可以分散设置,诸如将处理设备102、存储装置104、输入装置106和输出装置108集成设置于一体,而将图像采集设备110设置于可以采集到图像的指定位置。当上述电子系统中的各器件集成设置时,该电子系统可以被实现为诸如相机、智能手机、平板电脑、计算机、车载终端等智能终端。
图2为本发明实施例提供的一种图像处理方法的流程图,参见图2,该方法包括以下步骤:
S202:获取待处理图像;
待处理的图像为通过拍摄装置获取的低频图像,具体地,是相对于高频图像而言分辨率较低的图像,例如可以是通过手机等拍摄设备拍摄得到的低分辨率图像,通过对低频图像进行处理以得到高频图像。
S204:通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像;
多特征提取神经网络可以是单入多出的网络结构,例如可以是树形网络结构,其可以包括两层,也可以包括更多层,最后一层的多个分支输出多个输出图像,对于多层的树形结构,每层有多个分支,当前层的每个分支与下一层的多个分支连接,以得到更多不同的分支输出。
其中,任意两个输出图像之间的相似度小于第一相似度;第一相似度可以是一个预设的相似度值,该第一相似度可以根据经验进行设定,任意两个输出图像之间的相似度越大,说明两个图像越相似,反之,相似度越小,说明这两个图像的差异越大,本发明实施例中,每两个输出图像的相似度小于第一相似度,说明每两个图像的差异较大,即根据一个低频图像,得到多个差异较大的输出图像,这些差异较大的输出图像可以更好地从多方面反映低频图像的不同的高频特征。
多特征提取神经网络通过对包含多个低频图像与高频图像的样本图像对进行训练得到,多特征提取神经网络的训练过程将在下文详细阐述,在此不再赘述。
S206:将多个输出图像进行融合,得到待处理图像对应的高频图像。
多个输出图像可以经过一次或多次上采样,转换为维度相同的图像,再将维度相同的多个图像经过融合处理,得到对应的高频图像,其中,高频图像的分辨率高于低频图像。
本发明实施例提供的上述图像处理方法,首先获取待处理图像,通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像,再将多个输出图像进行融合,得到待处理图像对应的高频图像。由于多个具有不同高频特征的输出图像可以反映低频图像的不同方面的特征,因此,基于对多个具有不同高频特征的输出图像得到的高频图像,可以有效提高高频图像的精度。
在一些可能的实施方式中,多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的特征提取模块与下一层的至少一个特征提取模块连接,位于不同层的相互连接的特征提取模块构成多特征提取神经网络的一个通道。
在一例中,多特征提取神经网络可以为M*N的树形拓扑结构,M代表多特征提取神经网络的层数,N代表多特征提取神经网络中的第一层包含的初始模块个数,第一层与多特征提取神经网络中的中间层中的每个特征提取模块均与下一层的N个特征提取模块连接。
例如图3所示,图3为本发明实施例提供的一种多特征提取神经网络的结构示意图,图3中所示的多特征提取神经网络为2*2的完全二叉树结构,该多特征提取神经网络包括两个网络层,第一层包括两个节点(即特征提取模块),第二层包括四个节点,第一层中的每个节点分别与第二层中的两个节点连接,每个节点采用了超分辨率任务中常见的RG(Residual Group,残差组)模块。2个RG堆叠构成了一个分支模块。每一个RG由4个RCAB(Residual Channel Attention Block,残差注意力模块)组成。经过各个节点可以输出四个输出特征,四个输出特征与上采样模块连接,得到四个输出图像上采样模块可以具体为pixel shuffle(像素重组)模块。
其中,RCAB表示一个常用的超分辨率网络模块,RCAB的输入是一个特征,输入的特征经过两个分支,第一分支直接通过残差连接到模块结果,第二分支又分为两个子分支,第一子分支是卷积层(例如可以是两次卷积),另一个子分支是channel attention(通道注意力)层。应当注意的是,上述网络层数、RG模块和RCAB模块的数量仅是示例性的,具体可以是其他数量的组合。
基于此,上述步骤S204中通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像的步骤,可以具体包括:
(1)通过多特征提取神经网络对待处理图像进行第一特征提取,得到初始特征;
在获取低频图像后,可以通过多特征提取神经网络对低频图像进行特征提取,得到低频图像对应的初始特征,具体地,可以是采用多特征提取神经网络中的特征提取模块提取初始特征。
(2)通过多特征提取神经网络的多个通道中的当前通道对初始特征进行第二特征提取,得到该通道对应的输出特征;
其中,任意一个通道对应的输出特征的分辨率高于初始特征的分辨率;
(3)将每个通道的输出特征分别进行上采样处理,得到多个输出图像。
上采样处理的目的是得到大小相同的多个输出图像,每个通道的输出特征可以进行一次上采样操作,也可以进行多次上采样操作。
为了提高上述多特征提取神经网络中每一个通道得到的输出特征与初始特征的相似度,避免特征在各个层中传递时丢失,在多特征提取神经网络中的每个通道中,对初始特征进行如下第二特征提取操作:
(1)通过当前特征提取模块对输入特征进行第二特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为所述通道中的第一个特征提取模块,则所述输入特征为所述初始特征,否则,所述输入特征为上一个所述特征提取模块的输出特征;
(2)将所述初始输出特征和当前特征提取模块对应的所述输入特征组合,作为当前特征提取模块的输出特征;
(3)判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行所述第二特征提取操作;
(4)如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的输出特征。
图4为图3所示的多特征提取神经网络中的一个通道的结构及连接关系示意图,如图4所示,左侧方框为当前通道中的第一层,右侧方框为当前通道中的第二层,每一层中,包括两个特征提取模块,即图3中的两个RCAB模块构成一个特征提取模块,下面以图4为例说明上述将初始特征经过第二特征提取操作得到当前通道的输出特征的过程:为便于说明,将当前通道中的四个特征提取模块依次命名为M1-M4,在M1处,由于M1是当前通道的第一个特征提取模块,因此M1的输入特征为初始特征,通过M1对初始特征进行第二特征提取,得到M1的初始输出特征m1out-tmp,将m11与M1的输入特征(即初始特征)相加,得到M1的输出特征m1out,此时,判断M1是否为当前通道的最后一个特征提取模块,经判断,M1不是最后一个特征提取模块,因此将m1out作为下一个特征提取模块M2的输入特征,重复上述第二特征提取操作,M2、M3和M4的操作过程与上述M1的操作过程相同,在此不再赘述,当通过M4得到输出特征m4out后,经判断,M4是当前通道的最后一个特征提取模块,因此,将m4out与第一层的第一特征提取模块的输入特征(即初始特征)以及第二层的第一特征提取模块的输入特征(即M3的输入特征m2out)融合,得到当前通道的输出特征。
经过本发明上述实施例提供的多特征提取神经网络得到的输出图像,可以从多个角度体现待处理的低频图像的特征,得到分辨率较高的高频图像,如图5所示的低频图像与多特征提取神经网络的预测高频图像的对比示意图,图5中左侧大图为低频图像,右侧中的LR为需要进行预测的低频特征,Branch1-Branch4四个图为多特征提取神经网络的四个输出图像,HR为最终得到的高频图像。
在一些可能的实施方式中,上述将所述多个输出图像进行融合,得到所述低频图像对应的高频图像的步骤,可以具体是通过融合网络确定每个输出图像的权重;将各个输出图像按照对应的权重进行加权求和,得到高频图像。
具体地,可以将融合网络设计成两层卷积核大小为3*3的卷积层和一个softmax层,在该融合网络中,将多特征提取神经网络得到的多个输出图像一起经过2次卷积,将多个输出图像转换成相同维度,再经过softmax层,确定每个输出图像的融合权重,根据融合权重图分别逐像素的将四个输出图像进行加权,进一步地,将加权之后的图像逐像素相加产生最后的融合输出图像,即高频图像。
图6为经过本发明实施例的融合网络对四个输出图像进行融合的示意图,如图6所示,左侧的大图为低频图像,右侧的四个小图为经过多特征提取神经网络输出的四个输出图像,图像中方框越粗的区域,其在融合时对应的权重越高,也就是越清晰的部分,权重值越大,越模糊的部分,权重值越小,这样得到的融合图像更多的考虑了各个输出图像中清晰的部分,保证了融合图像的精度。
图7为本发明实施例提供的图像处理方法得到的高频图像的示意图,如图7所示,直线左侧为原始的低频图像,右侧为通过上述方法得到的高频图像,可见,本发明实施例提供的图像处理方法可以有效得到分辨率较高的高频图像。
本发明实施例提供的低频图像的处理方法,是基于第一神经网络对低频图像进行高频特征预测而得到高频图像的,高频图像的精度很大程度上取决于多特征提取神经网络的稳定性和输出结果的精度,因此,本发明实施例在上述方法的基础上,还提供了一种多特征提取神经网络的训练方法,参见图8所示的多特征提取神经网络训练方法的流程图,该方法包括以下步骤:
S802:获取样本图像及初始神经网络;
其中,样本图像包括训练图像及其对应的标签图像,标签图像的分辨率高于训练图像的分辨率;
S804:对所述样本图像进行第三特征提取,得到所述训练图像对应的训练特征;
S806:通过所述初始神经网络对所述训练特征进行第四特征提取,得到多个预测特征;
其中,所述预测特征的分辨率高于所述训练特征的分辨率。
S808:根据所述预测特征确定所述预测特征对应的预测图像;
具体地,可以是对多个所述预测特征分别进行上采样处理,得到多个所述预测特征对应的预测图像。
S810:根据所述预测图像及其对应的标签图像,确定总损失值。
S812:根据总损失值调整多特征提取神经网络的参数,直至满足第一训练停止条件。
在一些可能的实施方式中,上述多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的所述特征提取模块与下一层的至少一个所述特征提取模块连接,位于不同层的相互连接的所述特征提取模块构成所述多特征提取神经网络的一个通道;
基于上述多特征提取神经网络的结构,上述步骤S806中的通过所述多特征提取神经网络对所述训练特征进行第四特征提取,得到多个预测特征,可以具体是:
(1)通过当前特征提取模块对输入特征进行第四特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为所述通道中的第一个特征提取模块,则所述输入特征为所述训练特征,否则,所述输入特征为上一个所述特征提取模块的输出特征;
(2)将所述初始输出特征与当前特征提取模块对应的所述输入特征组合,作为当前特征提取模块的输出特征;
(3)判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行所述第四特征提取操作;
(4)如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的预测特征。
在一些可能的实施方式中,上述步骤S810中的总损失值可以按照如下方法进行确定:
根据每个预测图像及标签图像,得到该预测图像对应的第一损失值;根据每两个预测图像及标签图像,得到该两个预测图像对应的第二损失值;根据第一损失值和第二损失值,确定总损失值。
具体地,多特征提取神经网络的总损失值由第一损失值和第二损失值确定,第一损失值可以具体是L2 loss(均方误差)损失值,第二损失值可以具体是Triplet loss(三元损失)损失值。每一个输出图像和标签图像分别计算L2 loss损失值,然后把这些L2 Loss损失值加和构成整体的L2 loss。各个输出图像之间两两计算的Triplet loss损失值。
在一些可能的实施方式中,上述第二损失值的计算过程如下:
(1)根据标签图像确定第一正样本,根据两个预测图像中的第一预测图像确定第一负样本,根据两个预测图像中的第二预测图像确定第一锚样本;
(2)通过第一正样本、第一负样本以及第一锚样本进行三元损失值计算,得到第一三元损失值;
(3)根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本;
(4)通过第二正样本、第二负样本以及第二锚样本进行三元损失值计算,得到第二三元损失值;
(5)将第一三元损失值与第二三元损失值相加,得到第二损失值。
具体地,上述第二损失值是三元损失函数得到的损失值,三元损失函数tripletLoss的输入包括正样本、负样本和锚样本。为了达到任意两个图像之间差异较大,而这两个图像与标签图像的差异很小的效果,可以在任意两个输出图像之间计算triplet loss损失值,具体地,对任意两个输出图像分别计算两次triplet loss损失值,再将这两次tripletloss损失值组合,作为这两个图像的triplet loss损失值。例如,对于图像1和图像2,首先将标签图像作为正样本,图像1作为负样本,图像2作为锚样本,计算triplet loss损失值,得到loss1,再将标签图像作为正样本,图像1作为锚样本,图像2作为负样本,计算一次triplet loss损失值,得到loss2,那么loss1+loss2即为图像1和图像2对应的第二损失值。
因为超分任务主要是对高频纹理的恢复,如果对于输出图像之间直接使用Triplet loss计算损失值,可能会产生除了纹理之外的其他异化,如颜色,明暗等。因此本发明在上述方法的基础上,还对Triplet loss进行了进一步的改进,基于输出图像的灰度化信息进行tripletloss损失值的确定,基于此,上述第二损失值的确定过程还包括:
提取第一预测图像的第一灰度值和第二预测图像的第二灰度值;根据第一灰度值与标签图像确定第一残差;根据第二灰度值与标签图像确定第二残差;
基于此,上述根据所述标签图像确定第一正样本,根据所述两个预测图像中的第一预测图像确定第一负样本,根据所述两个预测图像中的第二预测图像确定第一锚样本的步骤,包括:
将第一残差确定为第一负样本;将第二残差确定为第一锚样本;
进一步地,上述根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本的步骤,包括:
将第一残差确定为第二锚样本;将第二残差确定为第二负样本。
图9为本发明实施例提供的一种第二损失值的计算过程示意图,如图9所示,代表第i个输出图像,代表第j个输出图像,i与j不相等,IHR代表标签图像,即高频图像,首先对三个图像进行灰度化,得到图像的灰度Y通道(YUV中的Y通道即灰度通道),即YHR和对特征进行灰度化可以防止出现色调上的异化,然后通过Norm层对灰度通道进行标准化处理,以突出纹理上的异化,防止出现明暗上的异化。
在一些可能的实施方式中,本发明实施例中的上述多特征提取神经网络为M*N的树形拓扑结构,M代表多特征提取神经网络的层数,N代表多特征提取神经网络中的第一层包含的初始模块个数,第一层与多特征提取神经网络中的中间层中的每个初始模块均与下一层的N个初始模块连接。
在一些可能的实施方式中,上述融合网络可以通过以下方法进行训练:
(1)获取初始融合网络;(2)根据每个预测图像及其对应的初始权重,确定预测融合图像;(3)根据预测融合图像和标签图像,确定第三损失值;(4)根据第三损失值调整初始融合网络的参数,直至满足第二训练停止条件。
上述的初始权重可以通过融合网络中的softmax层进行计算,各个输出图像根据初始权重进行加权相加,得到融合图像,将融合图像与标签图像进行损失值计算,得到第三损失值,这里的损失值的计算过程可以采用任何通用的损失函数,本发明实施例对此不进行限定。根据第三损失函数持续调整初始融合网络的参数,直到满足第二训练停止条件,完成初始融合网络的训练。其中,第二训练停止条件可以是训练次数或者第三损失值小于预设的某个值。
为了便于理解,下面结合具体应用场景对本发明提供的多特征提取神经网络以及融合网络的训练过程进行具体的描述,该训练过程具体包括以下步骤:
(1)获取一个低频图像Fig1和一个高频图像Fig2,并对低频图像进行特征提取,得到初始特征。
(2)设置多特征提取神经网络的初始结构和参数;
其中,多特征提取神经网络包括两层,每层中包括2个RG模块,即2个RG模块堆叠构成了一个分支。每一个RG由4个RCAB模块组成。上采样模块采用pixel shuffle模块。
(3)将初始图像输入多特征提取神经网络,在第一层中的第一个RG模块中,第一个RCAB模块的输入为初始特征,输出为特征1。第二个RCAB模块的输入为初始特征与特征1进行组合得到的组合特征1,输出为特征2。
(4)进入第二层的第一个RG模块中的第一个RCAB模块,输入是组合特征1和特征2进行组合得到的组合特征2。其他RCAB模块的输入与上述模块的输入的确定方法类似。
(5)继续进行其他模块的输出值的计算,直至得到最后一层的所有模块的输出,即四个输出图像S1、S2、S3和S4。
(6)计算S1-S4两两之间的tripletloss值,得到Tloss1-Tloss6六个损失值。
(7)分别计算S1-S4与高频图像Fig2的损失值loss1-loss4。
(8)将loss1-loss4以及Tloss1-Tloss6全部相加,得到总损失值。
(9)判断总损失值是否小于预设损失值,如果是,多特征提取神经网络训练完毕,否则,重复上述步骤(3)-(8)。
(10)将初始特征根据训练完毕的多特征提取神经网络进行处理,得到四个高频图像S11、S21、S31和S41。
(11)设置融合网络的初始结构和参数;
融合网络包括两层卷积核大小为3x3的卷积层以及一个softmax层。
(12)将四个图像S11-S41输入融合网络,得到融合图像M1;
(13)计算融合图像M1和高频图像Fig2的损失值,判断损失值是否小于预设的融合损失值,如果是,训练完毕,否则,重复上述步骤(10)-(11)。
为了进一步验证本发明实施例提供的图像处理方法的有益技术效果,下面通过三方面来验证对本发明的技术效果。
第一方面,将本发明实施方式提供的方法和现有技术中的多种方法在实验结果上进行对比,现有技术中的低频图像处理方法包括Bicubic上采样方法,直入直出的单一分支方法SRResNet、EDSR和RCAN,使用GAN的方法ESRGAN,多输出的方法:SRFlow,分治思想的方法LP-KPN和CDC。根据PSNR(Peak Signal to Noise Ratio)和SSIM(StructuralSIMilarity)作为对比指标,对比结果如表1所示:
表1
其中,RealSR数据集由Canon和Nikon两种单反相机通过变焦获得。RealSR数据集采集的场景有595种。分为三个超分辨率倍率(x2、x3、x4),训练数据总共有1265张,每个倍率的测试数据有随机抽取的100张。
为了验证模型的普适性,本发明在RealSR上进行了训练,在DRealSR上进行了效果验证。DRealSR数据集是另外一个使用了多种单反相机采集的真实数据集。
D2CRealSR为通过Sony单反相机采集的x8倍率的数据集,并在该数据集上进行了效果对比。在表1中,Ours为通过本发明实施例提供的方法得到的实验结果,通过表1可见,本发明实施例提供的图像处理方法在所有的实验中都取得了很好的客观指标(PSNR、SSIM)。
第二方面,将本发明实施方式提供的方法和现有技术中的方法得到的高频图像从图像的可视化的精确度方面进行对比,对比的结果如图10所示。图10中分别示出了针对Canon_045(x4)的低频图像中的一个部分进行高频预测得到的高频图像的对比图,其中Our代表本发明实施例提供的图像处理方法得到的高频图像,相比于其他现有技术,our对应的高频图像的图片清晰度明显较高。
第三方面,图11为获得高频图像时各个方法所使用的网络参数量的大小和图像效果,图中黑色圆圈表示本发明实施例提供的方法使用的网络参数量和指标,黑色外框的圆圈表示其他方法的网络参数量和指标,图横轴代表参数量大小,竖轴代表了在RealSR数据集的x4倍率下的PSNR指标。为了方便观看,圆圈越大表明参数量越大,可以看出,本发明实施例提供的方法全部位于左上角,且圆圈最小,表示我们的方法参数量小并且同时具有更好的超分辨率效果。
基于上述方法实施例,本发明实施例还提供一种图像处理装置,参见图12所示,该装置包括:
获取模块1202,用于获取待处理图像;
处理模块1204,用于通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像;其中,任意两个输出图像之间的相似度小于第一相似度;
融合模块1206,用于将多个输出图像进行融合,得到待处理图像对应的高频图像;其中,高频图像的分辨率高于待处理图像。
本发明实施例提供的上述图像处理装置,首先获取待处理图像,通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像,再将多个输出图像进行融合,得到待处理图像对应的高频图像。由于多个具有不同高频特征的输出图像可以反映低频图像的不同方面的特征,因此,基于对多个具有不同高频特征的输出图像得到的高频图像,可以有效提高高频图像的精度。
上述多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的特征提取模块与下一层的至少一个特征提取模块连接,位于不同层的相互连接的特征提取模块构成多特征提取神经网络的一个通道;上述通过多特征提取神经网络对待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像的过程,包括:通过多特征提取神经网络对待处理图像进行第一特征提取,得到初始特征;通过多特征提取神经网络的多个通道中的当前通道对初始特征进行第二特征提取,得到该通道对应的输出特征;其中,任意一个通道对应的输出特征的分辨率高于初始特征的分辨率;将每个通道的输出特征分别进行上采样处理,得到多个输出图像。
上述通过多特征提取神经网络的多个通道中的当前通道对初始特征进行第二特征提取,得到该通道对应的输出特征的过程,包括:通过当前特征提取模块对输入特征进行第二特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为通道中的第一个特征提取模块,则输入特征为初始特征,否则,输入特征为上一个特征提取模块的输出特征;将初始输出特征和当前特征提取模块对应的输入特征组合,作为当前特征提取模块的输出特征;判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行第二特征提取操作;如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的输出特征。
上述将多个输出图像进行融合,得到待处理图像对应的高频图像的步骤,包括:通过融合网络确定每个输出图像的权重;将各个输出图像按照对应的权重进行加权求和,得到高频图像。
上述多特征提取神经网络通过以下方式训练获得:获取样本图像及初始神经网络;其中,样本图像包括训练图像及其对应的标签图像,标签图像的分辨率高于训练图像的分辨率;对样本图像进行第三特征提取,得到训练图像对应的训练特征;通过初始神经网络对训练特征进行第四特征提取,得到多个预测特征;预测特征的分辨率高于训练特征的分辨率;根据预测特征确定预测特征对应的预测图像;根据预测图像及其对应的标签图像,确定总损失值;根据总损失值调整多特征提取神经网络的参数,直至满足第一训练停止条件。
上述多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的特征提取模块与下一层的至少一个特征提取模块连接,位于不同层的相互连接的特征提取模块构成多特征提取神经网络的一个通道;上述通过多特征提取神经网络对训练特征进行第四特征提取,得到多个预测特征的过程,包括:通过当前特征提取模块对输入特征进行第四特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为通道中的第一个特征提取模块,则输入特征为训练特征,否则,输入特征为上一个特征提取模块的输出特征;将初始输出特征与当前特征提取模块对应的输入特征组合,作为当前特征提取模块的输出特征;判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行第四特征提取操作;如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的预测特征。
上述根据预测图像及其对应的标签图像,确定总损失值的过程,包括:根据每个预测图像及标签图像,得到该预测图像对应的第一损失值;根据每两个预测图像及标签图像,得到该两个预测图像对应的第二损失值;根据第一损失值和第二损失值,确定总损失值。
上述根据每两个预测图像及标签图像,得到该两个预测图像对应的第二损失值的过程,包括:根据标签图像确定第一正样本,根据两个预测图像中的第一预测图像确定第一负样本,根据两个预测图像中的第二预测图像确定第一锚样本;通过第一正样本、第一负样本以及第一锚样本进行三元损失值计算,得到第一三元损失值;根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本;通过第二正样本、第二负样本以及第二锚样本进行三元损失值计算,得到第二三元损失值;将第一三元损失值与第二三元损失值相加,得到第二损失值。
上述装置还包括:灰度值提取模块,用于提取第一预测图像的第一灰度值和第二预测图像的第二灰度值;第一残差确定模块,用于根据第一灰度值与标签图像确定第一残差;第二残差确定模块,用于根据第二灰度值与标签图像确定第二残差;上述根据标签图像确定第一正样本,根据两个预测图像中的第一预测图像确定第一负样本,根据两个预测图像中的第二预测图像确定第一锚样本的过程,包括:将第一残差确定为第一负样本;将第二残差确定为第一锚样本;上述根据标签图像确定第二正样本,根据第一预测图像确定第二锚样本,根据第二预测图像确定第二负样本的过程,包括:将第一残差确定为第二锚样本;将第二残差确定为第二负样本。
上述多特征提取神经网络为M*N的树形拓扑结构,M代表多特征提取神经网络的层数,N代表多特征提取神经网络中的第一层包含的初始模块个数,第一层与多特征提取神经网络中的中间层中的每个初始模块均与下一层的N个初始模块连接。
上述融合网络通过以下方法训练获得;获取初始融合网络;根据每个预测图像及其对应的初始权重,确定预测融合图像;根据预测融合图像和标签图像,确定第三损失值;根据第三损失值调整初始融合网络的参数,直至满足第二训练停止条件。
本发明实施例提供的图像处理装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,上述装置的实施例部分未提及之处,可参考前述图像处理方法实施例中的相应内容。
本发明实施例还提供了一种电子设备,如图13所示,为该电子设备的结构示意图,其中,该电子设备包括处理器1301和存储器1302,该存储器1302存储有能够被该处理器1301执行的计算机可执行指令,该处理器1301执行该计算机可执行指令以实现上述图像处理方法。
在图13示出的实施方式中,该电子设备还包括总线1303和通信接口1304,其中,处理器1301、通信接口1304和存储器1302通过总线1303连接。
其中,存储器1302可能包含高速随机存取存储器(RAM,RandomAccess Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口1304(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线1303可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(PeripheralComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线1303可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器1301可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1301可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processor,简称DSP)、专用集成电路(ApplicationSpecific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器1301读取存储器中的信息,结合其硬件完成前述实施例的图像处理方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,该计算机可执行指令促使处理器实现上述图像处理方法,具体实现可参见前述方法实施例,在此不再赘述。
本发明实施例所提供的图像处理方法、装置及电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (14)
1.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像;
通过多特征提取神经网络对所述待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像;其中,任意两个所述输出图像之间的相似度小于第一相似度;
将所述多个输出图像进行融合,得到所述待处理图像对应的高频图像;其中,所述高频图像的分辨率高于所述待处理图像。
2.根据权利要求1所述的方法,其特征在于,多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的所述特征提取模块与下一层的至少一个所述特征提取模块连接,位于不同层的相互连接的所述特征提取模块构成所述多特征提取神经网络的一个通道;
通过多特征提取神经网络对所述待处理图像进行高频特征预测处理,得到具有不同高频特征的多个输出图像的步骤,包括:
通过所述多特征提取神经网络对所述待处理图像进行第一特征提取,得到初始特征;
通过所述多特征提取神经网络的多个通道中的当前通道对所述初始特征进行第二特征提取,得到该通道对应的输出特征;其中,任意一个所述通道对应的输出特征的分辨率高于所述初始特征的分辨率;
将每个所述通道的输出特征分别进行上采样处理,得到多个输出图像。
3.根据权利要求2所述的方法,其特征在于,通过所述多特征提取神经网络的多个通道中的当前通道对所述初始特征进行第二特征提取,得到该通道对应的输出特征的步骤,包括:
通过当前特征提取模块对输入特征进行第二特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为所述通道中的第一个特征提取模块,则所述输入特征为所述初始特征,否则,所述输入特征为上一个所述特征提取模块的输出特征;
将所述初始输出特征和当前特征提取模块对应的所述输入特征组合,作为当前特征提取模块的输出特征;
判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行所述第二特征提取操作;
如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的输出特征。
4.根据权利要求1所述的方法,其特征在于,将所述多个输出图像进行融合,得到所述待处理图像对应的高频图像的步骤,包括:
通过融合网络确定每个所述输出图像的权重;
将各个所述输出图像按照对应的权重进行加权求和,得到高频图像。
5.根据权利要求1所述的方法,其特征在于,所述多特征提取神经网络通过以下方式训练获得:
获取样本图像及初始神经网络;其中,所述样本图像包括训练图像及其对应的标签图像,所述标签图像的分辨率高于所述训练图像的分辨率;
对所述样本图像进行第三特征提取,得到所述训练图像对应的训练特征;
通过所述初始神经网络对所述训练特征进行第四特征提取,得到多个预测特征;所述预测特征的分辨率高于所述训练特征的分辨率;
根据所述预测特征确定所述预测特征对应的预测图像;
根据所述预测图像及其对应的标签图像,确定总损失值;
根据所述总损失值调整所述多特征提取神经网络的参数,直至满足第一训练停止条件。
6.根据权利要求5所述的方法,其特征在于,多特征提取神经网络包括多层,每一层中包括多个特征提取模块,前一层的所述特征提取模块与下一层的至少一个所述特征提取模块连接,位于不同层的相互连接的所述特征提取模块构成所述多特征提取神经网络的一个通道;
通过所述多特征提取神经网络对所述训练特征进行第四特征提取,得到多个预测特征的步骤,包括:
通过当前特征提取模块对输入特征进行第四特征提取,得到该特征提取模块对应的初始输出特征;其中,如果当前特征提取模块为所述通道中的第一个特征提取模块,则所述输入特征为所述训练特征,否则,所述输入特征为上一个所述特征提取模块的输出特征;
将所述初始输出特征与当前特征提取模块对应的所述输入特征组合,作为当前特征提取模块的输出特征;
判断当前特征提取模块是否为当前通道中的最后一个特征提取模块;如果否,继续执行所述第四特征提取操作;
如果是,将当前特征提取模块的输出特征与当前通道中每一层的第一个特征提取模块的输入特征融合,将融合结果确定为当前通道对应的预测特征。
7.根据权利要求5所述的方法,其特征在于,根据所述预测图像及其对应的标签图像,确定总损失值的步骤,包括:
根据每个所述预测图像及所述标签图像,得到该预测图像对应的第一损失值;
根据每两个所述预测图像及所述标签图像,得到该两个预测图像对应的第二损失值;
根据所述第一损失值和所述第二损失值,确定总损失值。
8.根据权利要求7所述的方法,其特征在于,根据每两个所述预测图像及所述标签图像,得到该两个预测图像对应的第二损失值的步骤,包括:
根据所述标签图像确定第一正样本,根据所述两个预测图像中的第一预测图像确定第一负样本,根据所述两个预测图像中的第二预测图像确定第一锚样本;
通过所述第一正样本、所述第一负样本以及所述第一锚样本进行三元损失值计算,得到第一三元损失值;
根据所述标签图像确定第二正样本,根据所述第一预测图像确定第二锚样本,根据所述第二预测图像确定第二负样本;
通过所述第二正样本、所述第二负样本以及所述第二锚样本进行三元损失值计算,得到第二三元损失值;
将所述第一三元损失值与所述第二三元损失值相加,得到第二损失值。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
提取所述第一预测图像的第一灰度值和所述第二预测图像的第二灰度值;
根据所述第一灰度值与所述标签图像确定第一残差;
根据所述第二灰度值与所述标签图像确定第二残差;
根据所述标签图像确定第一正样本,根据所述两个预测图像中的第一预测图像确定第一负样本,根据所述两个预测图像中的第二预测图像确定第一锚样本的步骤,包括:
将所述第一残差确定为第一负样本;
将所述第二残差确定为第一锚样本;
根据所述标签图像确定第二正样本,根据所述第一预测图像确定第二锚样本,根据所述第二预测图像确定第二负样本的步骤,包括:
将所述第一残差确定为第二锚样本;
将所述第二残差确定为第二负样本。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述多特征提取神经网络为M*N的树形拓扑结构,M代表所述多特征提取神经网络的层数,N代表所述多特征提取神经网络中的第一层包含的初始模块个数,所述第一层与所述多特征提取神经网络中的中间层中的每个所述初始模块均与下一层的N个所述初始模块连接。
11.根据权利要求1所述的方法,其特征在于,所述融合网络通过以下方法训练获得;
获取初始融合网络;
根据每个所述预测图像及其对应的初始权重,确定预测融合图像;
根据所述预测融合图像和所述标签图像,确定第三损失值;
根据所述第三损失值调整所述初始融合网络的参数,直至满足第二训练停止条件。
12.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至11任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至11任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111101722.2A CN114022354A (zh) | 2021-09-18 | 2021-09-18 | 图像处理方法、电子设备及计算机程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111101722.2A CN114022354A (zh) | 2021-09-18 | 2021-09-18 | 图像处理方法、电子设备及计算机程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114022354A true CN114022354A (zh) | 2022-02-08 |
Family
ID=80054670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111101722.2A Pending CN114022354A (zh) | 2021-09-18 | 2021-09-18 | 图像处理方法、电子设备及计算机程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022354A (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191382A (zh) * | 2018-10-18 | 2019-01-11 | 京东方科技集团股份有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
GB201900883D0 (en) * | 2019-01-22 | 2019-03-13 | Toshiba Kk | A computer vision system and method |
CN111028153A (zh) * | 2019-12-09 | 2020-04-17 | 南京理工大学 | 图像处理和神经网络训练方法、装置及计算机设备 |
CN111080528A (zh) * | 2019-12-20 | 2020-04-28 | 北京金山云网络技术有限公司 | 图像超分辨率和模型训练方法、装置、电子设备及介质 |
CN111161146A (zh) * | 2019-12-25 | 2020-05-15 | 大连理工大学 | 一种由粗糙到精细的单张图像超分辨率重建方法 |
CN111325050A (zh) * | 2018-12-13 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 输出信息的方法和装置 |
CN111369440A (zh) * | 2020-03-03 | 2020-07-03 | 网易(杭州)网络有限公司 | 模型训练、图像超分辨处理方法、装置、终端及存储介质 |
CN111476745A (zh) * | 2020-01-13 | 2020-07-31 | 杭州电子科技大学 | 一种进行运动模糊超分辨的多分支网络及方法 |
WO2020177189A1 (zh) * | 2019-03-06 | 2020-09-10 | 中国科学院自动化研究所 | 图像精细化阴影区域分割系统、方法、装置 |
CN111784623A (zh) * | 2020-09-07 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
WO2020216008A1 (zh) * | 2019-04-25 | 2020-10-29 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质及设备 |
WO2020233129A1 (zh) * | 2019-05-17 | 2020-11-26 | 深圳先进技术研究院 | 一种图像超分辨和着色方法、系统及电子设备 |
CN112488923A (zh) * | 2020-12-10 | 2021-03-12 | Oppo广东移动通信有限公司 | 图像超分辨率重建方法、装置、存储介质及电子设备 |
CN112767251A (zh) * | 2021-01-20 | 2021-05-07 | 重庆邮电大学 | 基于多尺度细节特征融合神经网络的图像超分辨率方法 |
CN113066013A (zh) * | 2021-05-18 | 2021-07-02 | 广东奥普特科技股份有限公司 | 视觉图像增强的生成方法、系统、装置及存储介质 |
CN113096019A (zh) * | 2021-04-28 | 2021-07-09 | 中国第一汽车股份有限公司 | 图像重建方法、装置、图像处理设备及存储介质 |
CN113129212A (zh) * | 2019-12-31 | 2021-07-16 | 深圳市联合视觉创新科技有限公司 | 图像超分辨率重建方法、装置、终端设备及存储介质 |
CN113139899A (zh) * | 2021-03-31 | 2021-07-20 | 桂林电子科技大学 | 高质量轻量级超分辨率重建网络模型设计方法 |
-
2021
- 2021-09-18 CN CN202111101722.2A patent/CN114022354A/zh active Pending
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191382A (zh) * | 2018-10-18 | 2019-01-11 | 京东方科技集团股份有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN111325050A (zh) * | 2018-12-13 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 输出信息的方法和装置 |
GB201900883D0 (en) * | 2019-01-22 | 2019-03-13 | Toshiba Kk | A computer vision system and method |
US20210065371A1 (en) * | 2019-03-06 | 2021-03-04 | Institute Of Automation, Chinese Academy Of Sciences | Refined segmentation system, method and device of image shadow area |
WO2020177189A1 (zh) * | 2019-03-06 | 2020-09-10 | 中国科学院自动化研究所 | 图像精细化阴影区域分割系统、方法、装置 |
WO2020216008A1 (zh) * | 2019-04-25 | 2020-10-29 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质及设备 |
WO2020233129A1 (zh) * | 2019-05-17 | 2020-11-26 | 深圳先进技术研究院 | 一种图像超分辨和着色方法、系统及电子设备 |
CN111028153A (zh) * | 2019-12-09 | 2020-04-17 | 南京理工大学 | 图像处理和神经网络训练方法、装置及计算机设备 |
CN111080528A (zh) * | 2019-12-20 | 2020-04-28 | 北京金山云网络技术有限公司 | 图像超分辨率和模型训练方法、装置、电子设备及介质 |
CN111161146A (zh) * | 2019-12-25 | 2020-05-15 | 大连理工大学 | 一种由粗糙到精细的单张图像超分辨率重建方法 |
CN113129212A (zh) * | 2019-12-31 | 2021-07-16 | 深圳市联合视觉创新科技有限公司 | 图像超分辨率重建方法、装置、终端设备及存储介质 |
CN111476745A (zh) * | 2020-01-13 | 2020-07-31 | 杭州电子科技大学 | 一种进行运动模糊超分辨的多分支网络及方法 |
CN111369440A (zh) * | 2020-03-03 | 2020-07-03 | 网易(杭州)网络有限公司 | 模型训练、图像超分辨处理方法、装置、终端及存储介质 |
CN111784623A (zh) * | 2020-09-07 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN112488923A (zh) * | 2020-12-10 | 2021-03-12 | Oppo广东移动通信有限公司 | 图像超分辨率重建方法、装置、存储介质及电子设备 |
CN112767251A (zh) * | 2021-01-20 | 2021-05-07 | 重庆邮电大学 | 基于多尺度细节特征融合神经网络的图像超分辨率方法 |
CN113139899A (zh) * | 2021-03-31 | 2021-07-20 | 桂林电子科技大学 | 高质量轻量级超分辨率重建网络模型设计方法 |
CN113096019A (zh) * | 2021-04-28 | 2021-07-09 | 中国第一汽车股份有限公司 | 图像重建方法、装置、图像处理设备及存储介质 |
CN113066013A (zh) * | 2021-05-18 | 2021-07-02 | 广东奥普特科技股份有限公司 | 视觉图像增强的生成方法、系统、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
MENGBEI YU; HONGJUAN WANG;MENGYANG LIU; PEI LI: "overview of research on image supe-resolution reconstruction", 《2021 IEEE INTERNATIONAL CONFERENCE ON INFORMATION COMMUNICATION AND SOFTWARE ENGINEERING(ICICSE)》, 23 April 2021 (2021-04-23) * |
马健: "基于超分辨率重建和聚焦区域检测的多聚焦图像融合", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 September 2021 (2021-09-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308200B (zh) | 神经网络的搜索方法及装置 | |
US11232286B2 (en) | Method and apparatus for generating face rotation image | |
CN112396115B (zh) | 基于注意力机制的目标检测方法、装置及计算机设备 | |
CN112862828B (zh) | 一种语义分割方法、模型训练方法及装置 | |
WO2021218238A1 (zh) | 图像处理方法和图像处理装置 | |
CN109816659B (zh) | 图像分割方法、装置及系统 | |
CN112767466A (zh) | 一种基于多模态信息的光场深度估计方法 | |
CN110222718A (zh) | 图像处理的方法及装置 | |
CN112508989B (zh) | 一种图像处理方法、装置、服务器以及介质 | |
CN112836625A (zh) | 人脸活体检测方法、装置、电子设备 | |
CN110532959B (zh) | 基于双通道三维卷积神经网络的实时暴力行为检测系统 | |
CN115797731A (zh) | 目标检测模型训练方法、检测方法、终端设备及存储介质 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
CN116453232A (zh) | 人脸活体检测方法、人脸活体检测模型的训练方法和装置 | |
CN112800978A (zh) | 属性识别方法、部位属性提取网络的训练方法和装置 | |
CN116977674A (zh) | 图像匹配方法、相关设备、存储介质及程序产品 | |
CN114202457A (zh) | 低分辨率图像的处理方法、电子设备及计算机程序产品 | |
CN111814534A (zh) | 视觉任务的处理方法、装置和电子系统 | |
CN111242176A (zh) | 计算机视觉任务的处理方法、装置及电子系统 | |
CN116403064B (zh) | 图片处理方法、系统、设备及介质 | |
CN113450362A (zh) | 一种视频目标分割方法、装置和电子系统 | |
CN114022354A (zh) | 图像处理方法、电子设备及计算机程序产品 | |
WO2022252519A1 (zh) | 图像处理方法、装置、终端、介质和程序 | |
CN114973424A (zh) | 特征提取模型训练、手部动作识别方法、装置及电子设备 | |
CN112203023B (zh) | 一种十亿像素视频生成方法及装置、设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |