CN112132770A - 图像修复的方法、装置、计算机可读介质及电子设备 - Google Patents
图像修复的方法、装置、计算机可读介质及电子设备 Download PDFInfo
- Publication number
- CN112132770A CN112132770A CN202010995966.9A CN202010995966A CN112132770A CN 112132770 A CN112132770 A CN 112132770A CN 202010995966 A CN202010995966 A CN 202010995966A CN 112132770 A CN112132770 A CN 112132770A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- feature map
- map
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000004927 fusion Effects 0.000 claims abstract description 32
- 238000010586 diagram Methods 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 238000005429 filling process Methods 0.000 claims description 10
- 230000008439 repair process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 24
- 238000013473 artificial intelligence Methods 0.000 abstract description 13
- 230000001976 improved effect Effects 0.000 abstract description 8
- 238000010801 machine learning Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 22
- 230000008569 process Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 11
- 230000002146 bilateral effect Effects 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请的实施例提供了一种图像修复的方法、装置、计算机可读介质及电子设备,涉及人工智能中的计算机视觉技术、机器学习以及自动驾驶等技术。通过提取出待处理图像中的纹理特征图和结构特征图,并对纹理特征图和结构特征图进行融合得到融合特征图,以保证图像特征中纹理信息和结构信息的完整性;通过基于融合特征图中相邻特征通道之间的空间距离和特征相似度生成融合特征图对应的均衡特征,以基于相邻特征通道之间的空间距离关系和特征相似度提高特征之间全局特征和局部特征的相关性;最后基于均衡特征对图像特征修复待处理图像的结构和纹理生成修复图像,确保全局特征和局部特征的一致性,提高图像信息的完整性和图像恢复的精确性。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种图像修复的方法、装置、计算机可读介质及电子设备。
背景技术
在一些图像获取场景中,由于场景的特殊性,往往导致获取到的图像不清楚、图像失真较大等问题。相关技术中通过对图像进行的恢复来得到比较清晰的图像,例如通过图像特征填充等方式。这些方式容易丢失掉原有图像中的信息,使得原有图像的特征不够完整或者不一致,进而导致图像恢复结果不够精确的问题。
发明内容
本申请的实施例提供了一种图像修复的方法、装置、计算机可读介质及电子设备,进而至少在一定程度上可以确保修复图像中全局特征和局部特征的一致性,提高图像信息的完整性和图像恢复的精确性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种图像修复的方法,包括:基于待处理图像中的图像特征,提取出所述待处理图像的纹理特征图和结构特征图;将所述纹理特征图和所述结构特征图进行融合,得到融合特征图;基于所述融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定所述融合特征图对应的均衡特征;基于所述均衡特征对所述图像特征进行图像重建,生成所述待处理图像对应的修复图像。
根据本申请实施例的一个方面,提供了一种图像修复的装置,包括:提取单元,用于基于待处理图像中的图像特征,提取出所述待处理图像的纹理特征图和结构特征图;融合单元,用于将所述纹理特征图和所述结构特征图进行融合,得到融合特征图;确定单元,用于基于所述融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定所述融合特征图对应的均衡特征;重建单元,用于基于所述均衡特征对所述图像特征进行图像重建,生成所述待处理图像对应的修复图像。
在本申请的一些实施例中,基于前述方案,所述图像特征包括浅层特征图和深层特征图;所述提取单元包括:第一提取单元,用于通过编码器中的浅层卷积网络从所述待处理图像中提取浅层特征图,并对所述浅层特征图进行重组,生成所述纹理特征图;第二提取单元,用于通过编码器中的深层卷积网络从所述待处理图像中提取深层特征图,并对所述深层特征图进行重组,生成所述结构特征图。
在本申请的一些实施例中,基于前述方案,所述第一提取单元包括:第一调整单元,用于基于设定的图像大小,对各所述浅层特征图的大小进行调整,得到大小统一的目标浅层特征图;第一级联单元,用于将各所述目标浅层特征图进行级联,生成所述纹理特征图;
在本申请的一些实施例中,基于前述方案,所述第一提取单元包括:第二调整单元,用于基于设定的图像大小,对所述深层特征图的大小进行调整,得到大小统一的目标深层特征图;第二级联单元,用于将所述目标深层特征图进行级联,生成所述结构特征图。
在本申请的一些实施例中,基于前述方案,所述重建单元包括:特征解码单元,用于基于所述编码器生成的所述待处理图像对应于各特征级别的编码特征,通过所述编码器对应的解码器,对所述编码特征进行解码处理,得到各特征级别对应的图像特征;所述特征级别浅层卷积网络和深层卷积网络;图像重建单元,用于基于所述均衡特征对所述各特征级别对应的图像特征进行图像重建,生成所述待处理图像对应的修复图像。
在本申请的一些实施例中,基于前述方案,所述融合单元包括:第一填充单元,用于对所述纹理特征图进行特征填充,得到填充纹理特征图;第二填充单元,用于对所述结构特征图进行特征填充,得到填充结构特征图;第三级联单元,用于将所述填充纹理特征图和所述填充结构特征图进行级联,得到级联特征图;第一卷积单元,用于对所述级联特征图进行卷积,生成与所述待处理图像大小相同的融合特征图。
在本申请的一些实施例中,基于前述方案,所述第一填充单元包括:内核确定单元,用于基于所述纹理特征图的大小,确定进行特征填充时对应的各卷积内核大小;特征填充单元,用于基于所述各卷积内核大小,对所述纹理特征图进行特征填充,得到各填充特征;第四级联单元,用于对所述各填充特征进行级联,得到填充纹理特征图。
在本申请的一些实施例中,基于前述方案,所述图像修复的装置还包括:第一映射单元,用于将所述填充纹理特征图映射到第一彩色纹理图中;第一损失单元,用于基于所述待处理图像与所述第一彩色纹理图之间的像素差矩阵,生成第一损失参数;第一调整单元,用于基于所述第一损失参数调整所述纹理特征图在特征填充过程中的参数。
在本申请的一些实施例中,基于前述方案,所述图像修复的装置还包括:第二映射单元,用于将所述填充结构特征图映射到第二彩色结构图中;结构图像获取单元,用于获取所述待处理图像对应的结构图像;第二损失单元,用于基于所述结构图像与所述第二彩色结构图之间的像素差矩阵,生成第二损失参数;第二调整单元,用于基于所述第二损失参数调整所述结构特征图在特征填充过程中的参数。
在本申请的一些实施例中,基于前述方案,所述确定单元包括:展开单元,用于对所述融合特征图进行特征展开处理,得到各特征通道对应的特征值向量;第一确定单元,用于基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定所述相邻特征通道之间的特征相似度;第二确定单元,用于基于所述相邻的特征通道对应的特征值向量,通过高斯函数确定所述待处理图像中相邻特征通道对应的空间距离;第五级联单元,用于基于所述特征相似度和所述空间距离得到的级联矩阵,确定所述融合特征图对应的均衡特征。
在本申请的一些实施例中,基于前述方案,所述第一确定单元用于:对所述相邻的特征通道对应的特征值向量进行逐元素相乘运算,得到元素乘积;基于设定的归一化因子对所述元素乘积进行均值计算,得到所述相邻的特征通道之间的特征相似度。
在本申请的一些实施例中,基于前述方案,所述第二确定单元用于:基于所述相邻的特征通道之间的距离以及所述特征通道对应的特征值向量,通过高斯函数生成所述特征通道对应的调整距离;基于设定的归一化因子对所述调整距离进行均值计算,得到所述空间距离。
在本申请的一些实施例中,基于前述方案,所述第五级联单元,包括:对所述特征相似度和所述空间距离进行级联,生成级联矩阵;基于设定的卷积核对所述级联矩阵进行采样处理,生成所述均衡特征。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的图像修复的方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的图像修复的方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的图像修复的方法。
在本申请的一些实施例所提供的技术方案中,通过基于待处理图像中的图像特征,提取出待处理图像中的纹理特征图和结构特征图,并对纹理特征图和结构特征图进行融合,得到融合特征图,以保证图像特征中纹理信息和结构信息的完整性;通过基于融合特征中相邻特征通道之间的空间距离和特征相似度生成融合特征图对应的均衡特征,以基于相邻特征通道之间的空间距离关系和特征相似度提高特征之间全局特征和局部特征的相关性;最后基于均衡特征对图像特征进行图像重建,同时修复待处理图像的结构和纹理,生成修复图像,确保了修复图像中全局特征和局部特征的一致性,提高图像信息的完整性和图像恢复的精确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示意性示出了根据本申请的一个实施例的实施例车载网络中的图像修复实例的示意图;
图3示意性示出了根据本申请的一个实施例的图像修复的方法的流程图;
图4示意性示出了根据本申请的一个实施例的提取特征图的流程图;
图5示意性示出了根据本申请的一个实施例的通过编码器提取图像中的特征图的示意图;
图6示意性示出了根据本申请的一个实施例的将纹理特征图和结构特征图进行融合的流程图;
图7示意性示出了根据本申请的一个实施例的图像修复的示意图;
图8示意性示出了根据本申请的一个实施例的基于卷积核进行特征填充修复的示意图;
图9示意性示出了根据本申请的一个实施例的生成均衡特征的流程图;
图10示意性示出了根据本申请的一个实施例的生成均衡特征的示意图;
图11示意性示出了根据本申请的一个实施例的基于均衡特征对图像特征进行图像重建的流程图;
图12示意性示出了根据本申请的一个实施例的基于编码器和解码器过程的图像修复网络的示意图;
图13示意性示出了根据本申请的一个实施例的图像修复的装置的框图;
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习式教学习等技术。自动驾驶技术通常包括高精地图、环境感知、行为决策、路径规划、运动控制等技术,自定驾驶技术有着广泛的应用前景,
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的计算机视觉技术、机器学习以及自动驾驶等技术,具体通过如下实施例进行说明:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种,当然也可以是台式计算机等等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线通信链路、无线通信链路等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
用户可以使用终端设备通过网络104与服务器105交互,例如发送图像和接收图像等。服务器105可以是提供各种服务的服务器。例如用户利用终端设备103(也可以是终端设备101或102)向服务器105上传了待处理图像,服务器105基于待处理图像中的图像特征,提取出待处理图像的纹理特征图和结构特征图;将纹理特征图和结构特征图进行融合,得到融合特征图;基于融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定融合特征图对应的均衡特征;基于均衡特征对图像特征进行图像重建,生成待处理图像对应的修复图像。
上述方案,通过基于待处理图像中的图像特征,提取出待处理图像中的纹理特征图和结构特征图,并对纹理特征图和结构特征图进行融合,得到融合特征图,以保证图像特征中纹理信息和结构信息的完整性;通过基于融合特征中相邻特征通道之间的空间距离和特征相似度生成融合特征图对应的均衡特征,以基于相邻特征通道之间的空间距离关系和特征相似度提高特征之间全局特征和局部特征的相关性;最后基于均衡特征对图像特征进行图像重建,同时修复待处理图像的结构和纹理,生成修复图像,确保了修复图像中全局特征和局部特征的一致性,提高图像信息的完整性和图像恢复的精确性。
需要说明的是,本申请实施例所提供的图像修复的方法一般由服务器105执行,相应地,图像修复的装置一般设置于服务器105中。但是,在本申请的其它实施例中,终端设备也可以与服务器具有相似的功能,从而执行本申请实施例所提供的图像修复的方案。
图2示出了根据本申请的一个实施例车载网络中的图像修复实例的示意图。
如图2所示,在本申请一实施例中,车辆201中设有通信装置202,用于接收和发送数据;车辆201中还设有摄像装置205,用于获取车辆在停靠或者行驶过程中的周围环境图像或视频。
本实施例中,通过摄像装置205采集到车辆周围的环境图像之后,通过通信装置202将图像发送至服务器204中,服务器204将环境图像作为待处理图像,基于待处理图像中的图像特征,提取出待处理图像的纹理特征图和结构特征图;将纹理特征图和结构特征图进行融合,得到融合特征图;基于融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定融合特征图对应的均衡特征;基于均衡特征对图像特征进行图像重建,生成待处理图像对应的修复图像。之后,服务器204将修复图像返回至通信装置202,通信装置202将修复图像传输至车辆201中的控制装置中,以使控制装基于修复图像识别当前环境中的障碍或者道路情况,以作出当前的行使决策。
进一步的,本实施例中的环境图像修复过程还可以通过上述方法移除车辆传感器视野中不必要的遮挡物,提高在自动驾驶中的车辆可控性和避险能力。
上述方案中,通过对环境图像中提取得到的纹理特征图和结构特征图进行融合,得到融合特征图,以保证图像特征中纹理信息和结构信息的完整性,并基于融合特征中相邻特征通道之间的空间距离和特征相似度生成融合特征图对应的均衡特征,以基于相邻特征通道之间的空间距离关系和特征相似度提高特征之间全局特征和局部特征的相关性;最后基于均衡特征对图像特征进行图像重建,同时修复待处理图像的结构和纹理,生成修复图像,确保了修复图像中全局特征和局部特征的一致性,提高环境信息的完整性和精确性,以使得可以基于精确的环境恢复图像制定对应的行使策略,进而为车辆行驶提供了更多的安全保障。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图3示出了根据本申请的一个实施例的图像修复的方法的流程图,该图像修复的方法可以由服务器来执行,该服务器可以是图1中所示的服务器。参照图3所示,该图像修复的方法至少包括步骤S310至步骤S340,详细介绍如下:
在步骤S310中,基于待处理图像中的图像特征,提取出待处理图像的纹理特征图和结构特征图。
在本申请的一个实施例中,首先获取待处理图像,本实施例中的待处理图像可以为实时拍摄到的环境场景图像、人脸图像等等。其中,获取待处理图像的方式可以是通过摄像装置实时获取到的,也可以是从存储装置中提取得到的等等。在获取到待处理图像之后,基于待处理图像中的图像特征,提取其中的纹理特征图和结构特征图。
在图像处理的实际应用中,数字图像由众多像素组成,像素是组成数字图像的基本单位,每一个像素的亮度与色彩信息被独立记录下来,它们代表了像素的亮度与色彩。本实施例中纹理特征图中包含了待处理图像中的纹理信息,纹理信息是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性,例如房屋的墙面对应的图像区域、道路中间区域对应的图像区域等。本实施例中的结构特征图包括待处理中的结构、骨架等信息,其中包括比较深层的图像信息,通过这些信息可以确定图像中的物体的结构、排布情况等,例如图像中房屋的边缘、道路两侧的区域。
在本申请的一个实施例中,如图4所示,图像特征包括浅层特征图和深层特征图;步骤S310中基于待处理图像中的图像特征,提取出待处理图像的纹理特征图和结构特征图的过程,包括如下步骤:
在步骤S311中,通过编码器中的浅层卷积网络从待处理图像中提取浅层特征图,并对浅层特征图进行重组,生成纹理特征图。
在本申请的一个实施例中设有编码器和解码器,主要用于通过卷积神经网络的设计来提取图片中特定的空间结构特征信息,并且将特征信息恢复到图像层级。输入图片在编码器的作用下最终会变为包含特定特征信息的特征图(Feature Map)。本实施例中待处理图像输入编码器中,进而得到包含各特征信息的特征图。
具体的,本实施例中的编码器中包含浅层卷积网络,用于基于浅层卷积网络对待处理图像进行卷积处理,进而提取浅层特征图。
图5为本申请实施例提供的一种通过编码器提取图像中的特征图的示意图。
如图5所示,本实施例中的编码器中包含有浅层卷积网络520和深层卷积网络530。本实施例中通过将待处理图像510输入编码器中,分别在浅层卷积网络520中输出浅层特征图530,并在深层卷积网络540中输出深层卷积特征550。
在本申请的一个实施例中,在提取得到浅层特征图之后,步骤S311中并对浅层特征图进行重组,生成纹理特征图的过程,包括如下步骤:基于设定的图像大小,对各浅层特征图的大小进行调整,得到大小统一的目标浅层特征图;将各目标浅层特征图进行级联,生成纹理特征图。
在本申请的一个实施例中,每个浅层特征图的大小都是不同的,本实施例中通过基于设定的图像大小,对各浅层特征图的大小进行调整,得到大小统一的目标浅层特征图,进而对个目标浅层特征图进行级联,生成浅层特征对应的纹理特征图。上述方案中,通过对统一大小以后的特征图进行级联,保留了各个特征级别对应的图像特征,提升了图像信息的完整性。
在步骤S312中,通过编码器中的深层卷积网络从待处理图像中提取深层特征图,并对深层特征图进行重组,生成结构特征图。
请继续参考图5所示,在本申请的一个实施例中,本实施例中的编码器中包含深层卷积网络,用于基于深层卷积网络对待处理图像进行卷积处理,进而提取深层特征图。之后,对深层特征图进行重组,生成结构特征图。
在本申请的一个实施例中,步骤S312中对深层特征图进行重组,生成结构特征图,包括如下步骤:基于设定的图像大小,对深层特征图的大小进行调整,得到大小统一的目标深层特征图;将目标深层特征图进行级联,生成结构特征图。
本实施例中在获取到深层特征图之后,对深层特征图进行重组的过程中,基于设定的图像大小,先进行深层特征图的大小调整,在基于调整后的特征图进行级联,得到结构特征图。上述方案中,通过对统一大小以后的结构特征图进行级联,保留了各个特征级别对应的结构图像特征,提升了结构图像信息的完整性。
在步骤S320中,将纹理特征图和结构特征图进行融合,得到融合特征图。
在本申请的一个实施例中,在生成纹理特征图和结构特征图之后,将纹理特征图和结构特征图进行融合得到融合特征图。本实施例中的融合特征图包含了待处理图像中的纹理信息和结构信息,以便于通过融合特征图中的信息得到对应的注意力权重,以对图像进行均衡处理。
在本申请的一个实施例中,如图6所示,步骤S320中将纹理特征图和结构特征图进行融合,得到融合特征图的过程,包括步骤S321~S324:
在步骤S321中,对纹理特征图进行特征填充,得到填充纹理特征图。
在本申请的一个实施例中,在对纹理特征图进行填充时,可以通过不同的卷积核对纹理特征图进行卷积处理,进而达到填充和修复的目的,即生成填充纹理特征图。
在本申请的一个实施例中,步骤S321中对纹理特征图进行特征填充,得到填充纹理特征图的过程,具体包括如下步骤:基于纹理特征图的大小,确定进行特征填充时对应的各卷积内核大小;基于各卷积内核大小,对纹理特征图进行特征填充,得到各填充特征;对各填充特征进行级联,得到填充纹理特征图。
图7为本申请实施例提供的一种图像修复的示意图。
如图7所示,在本申请一实施例中,通过对待处理处理710输入到编码器的多层卷积网络中,例如浅层卷积网络720和深层卷积网络740中,分别得到纹理特征图730和结构特征图750。在对这两个图像进行填充修复时,可以基于不同大小的卷积核来进行处理。
具体的,如图7所示,本实施例中在对纹理特征图Fte730进行填充修复时,即多尺度填充750的过程,所用到的卷积核大小分别为ks:3×3、5×5以及7×7,通过基于上述卷积核对纹理特征图进行卷积处理,以实现特征填充和修复,得到各卷积核对应的填充特征;之后对各填充特征进行级联,得到填充纹理特征图Ffte(780)。
图8为本申请实施例提供的一种基于卷积核进行特征填充修复的示意图。
如图8所示,本实施例中的卷积和大小还可以为其它组合和其它数量。例如,对纹理特征图810进行填充修复时,所用到的卷积核820大小分别为ks:2×2、4×4、6×6以及7×8;通过基于上述卷积核对纹理特征图进行卷积处理,以实现特征填充和修复,得到各卷积核对应的填充特征;之后对各填充特征进行级联830,得到填充纹理特征图840。
在步骤S322中,对结构特征图进行特征填充,得到填充结构特征图。
请继续参阅图7所示,在本申请的一个实施例中,对于结构特征图Fst750进行特征填充的过程中,所用到的卷积核大小分别为ks:3×3、5×5以及7×7,通过基于上述卷积核对结构特征图进行卷积处理,以实现特征填充和修复,得到各卷积核对应的填充特征;之后对各填充特征进行级联,得到填充结构特征图Ffst770。
需要说明的是,步骤S321和步骤S322之间的执行顺序可以是并联同步执行的顺序,也可以是串联依次执行的顺序等方式。
在步骤S323中,将填充纹理特征图和填充结构特征图进行级联,得到级联特征图。
请继续参阅图7所示,在本申请的一个实施例中,在生成填充纹理特征图780和填充结构特征图770之后,对填充纹理特征图780和填充结构特征图770进行级联,得到级联特征图790。
进一步的,本实施例中,对纹理特征图进行特征填充,得到填充纹理特征图之后,还包括:将填充纹理特征图映射到第一彩色纹理图中;基于待处理图像与第一彩色纹理图之间的像素差矩阵,生成第一损失参数;基于第一损失参数调整纹理特征图在特征填充过程中的参数。
对结构特征图进行特征填充,得到填充结构特征图之后,还包括:将填充结构特征图映射到第二彩色结构图中;获取待处理图像对应的结构图像;基于结构图像与第二彩色结构图之间的像素差矩阵,生成第二损失参数;基于第二损失参数调整结构特征图在特征填充过程中的参数。
具体的,本实施例中为了确保孔洞区域能够填充上合理的纹理和结构,本实施例对填充结构特征图Ffst和填充纹理特征图Ffte进行了监督。本实施例使用1×1卷积分别将Ffst和Ffte分别映射到彩色图像Iost和彩色图像Iote。并分别与原始图像计算损失:
Lrst=||Iost-Ist||1
Lrte=||Iote-Igt||1
其中,Igt表示原始图像,即待处理图像;Ist表示Igt对应的结构图像。可选的,本实施例中通过保留边缘的平滑方法来生成Ist。在计算得到损失参数之后,基于损失参数调整对应的特征填充过程中的参数。通过上述方式,进而得到更加精确的图像填充和修复结果。
在步骤S324中,对级联特征图进行卷积,生成与待处理图像大小相同的融合特征图。
在本申请的一个实施例中,在生成级联特征图之后,对级联特征图进行卷积,生成与待处理图像大小相同的融合特征图。示例性的,将级联特征图通过1×1卷积,映射到与待处理图像相同的大小。
具体的,纹理特征图Fte和结构特征图Fst中的孔区域分别在结构和纹理分支中被填充完毕,填充结构特征图Ffst和填充纹理特征图Ffte中的特征表示不一致,以反映恢复的结构和纹理。为减轻这些影响,本实施例将填充结构特征图Ffst和填充纹理特征图Ffte连接起来,并通过1×1卷积层进行简单融合以生成融合特征图Fsf。融合特征图Fsf中的纹理和结构表示可通过在不同卷积特征级别的特征均衡进行校正。均衡之后的特征通过编码器与解码器之间的跳跃连接在所有特征级别补充解码器的语义损失。
在步骤S330中,基于融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定融合特征图对应的均衡特征。
请继续参阅图7所示,在本申请的一个实施例中,在生成融合特征图之后,基于融合特征图确定相邻特征通道之间的特征相似度,进行通道均衡处理711,同时基于融合特征图确定相邻特征通道之间的空间距离,进行空间均衡处理712,以确定融合特征图对应的均衡特征,使得均衡之后的特征通过编码器720和解码器713之间的跳跃连接能在所有特征级别补充解码器的语义损失。
在本申请的一个实施例中,如图9所示,步骤S330中基于融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定融合特征图对应的均衡特征的过程,包括步骤S331~步骤S334:
在步骤S331中,对融合特征图进行特征展开处理,得到各特征通道对应的特征值向量。
图10为本申请实施例提供的一种生成均衡特征的示意图。
如图10所示,在本申请的一个实施例中,在距离步骤1010中,对融合特征图C×H×W进行展开处理(其中,W是图像的宽度、H是高度、C是通道的个数),分别得到HW×3×3×C、HW×1×1×C以及HW×C×3×3。在空间步骤1020中,对融合特征图为C×H×W进行展开处理,得到HW×C×H×W。
本申请实施例通过对融合特征图进行特征展开处理,得到各特征通道对应的特征值向量,以获得每个xi的所有相邻xj,以便本实施例可以进行高效的逐元素矩阵乘法。
在步骤S332中,基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定相邻特征通道之间的特征相似度。
在本申请的一个实施例中,步骤S332中基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定相邻特征通道之间的特征相似度的过程,包括如下步骤:对相邻的特征通道对应的特征值向量进行逐元素相乘运算,得到元素乘积;基于设定的归一化因子对元素乘积进行均值计算,得到相邻的特征通道之间的特征相似度。
请继续参考图10所示,在本申请的一个实施例中,在距离步骤1010中,对特征HW×3×3×C和特征HW×1×1×C进行逐元素相乘运算P1,得到元素乘积HW×3×3×C;之后将各通道的特征进行逐元素相加得到HW×3×3;之后通过回归处理,将得到的结果与特征HW×C×3×3之间进行P2运算,得到HW×C×3×3;之后各通道的特征进行逐元素相加得到HW×C。
具体的,本实施例中的P2运算详细说明如下:
本实施例通过提出的双边传播激活函数(BPA)将通道均衡传播到空间域。BPA受到双边滤波的启发,以基于空间生成响应值,其公式如下所示:
其中,xi表示输入图像中i位置处的特征通道;xj表示在位置j处并且位于i位置周围的相邻特征通道;表示经过局部特征的距离相似性测量后得到的特征通道;本实施例中将归一化因子设置为C(x)=N,其中N表示x中的特征点数。
在计算时,本实施例在围绕在i的相邻区域v中通过f(.)测量特征通道xi和xj之间的特征相似度。示例性的,v的大小可以为3×3。在特征相似度计算步骤中,本实施例将成对函数f(.)定义为点积运算符号,其公式描述如下:
f(xi,xj)=(xj)T(xj)
本实施例提出的双边传播在双边权重计算过程中同时考虑了特征通道相似性和xi与xj之间的空间距离,通过使用局部区域v来计算值的距离,以确保当前要素通道周围的局部一致性。
在步骤S333中,基于相邻的特征通道对应的特征值向量,通过高斯函数确定待处理图像中相邻特征通道对应的空间距离。
在本申请的一个实施例中,在得到图像的特征通道对应的特征值向量之后,基于相邻的特征通道对应的特征值向量,通过高斯函数确定待处理图像中相邻特征通道对应的空间距离。具体说明如下:
在本申请的一个实施例中,步骤S333中基于相邻的特征通道对应的特征值向量,通过高斯函数确定待处理图像中相邻特征通道对应的空间距离的过程,包括如下步骤:基于相邻的特征通道之间的距离以及特征通道对应的特征值向量,通过高斯函数生成特征通道对应的调整距离;基于设定的归一化因子对调整距离进行均值计算,得到空间距离。
在本申请的一个实施例中,本实施例通过提出的双边传播激活函数将通道均衡传播到空间域。受到双边滤波的启发以基于空间生成响应值,通过高斯函数生成空间距离的公式如下所示:
本实施例中,双边传播利用了特征之间空间域和范围域的距离。本实施例在相邻区域s中探索j的位置,s设置为与输入要素相同的空间大小,这样是为了进行全局传播。相邻特征通道的空间域距离通过高斯函数gαs进行调整。在得到调整距离之后,基于设定的归一化因子C(x)对调整距离进行均值计算,得到空间距离。
在步骤S334中,基于特征相似度和空间距离得到的级联矩阵,确定融合特征图对应的均衡特征。
请继续参考图7所示,在本申请的一个实施例中,在确定了通道均衡711对应的特征相似度、以及空间均衡712对应的空间距离之后,基于特征相似度和空间距离得到的级联矩阵,确定融合特征图对应的均衡特征。
在本申请的一个实施例中,步骤S334中基于特征相似度和空间距离得到的级联矩阵,确定融合特征图对应的均衡特征,包括如下步骤:对特征相似度和空间距离进行级联,生成级联矩阵;基于设定的卷积核对级联矩阵进行采样处理,生成均衡特征。
请继续参考图10所示,对特征相似度C×H×W和空间距离C×H×W进行级联C×H×W,生成级联矩阵2C×H×W;之后,基于设定的卷积核对级联矩阵进行采样处理,生成均衡特征C×H×W。
本实施例通过提出的双边传播激活函数(BPA)将通道均衡传播到空间域,以基于空间生成响应值,生成均衡特征的公式如下所示:
综上可述,本实施例使用全局区域s来计算空间距离,而使用局部区域v来计算值的距离。双边传播既通过计算的考虑到了特征的全局连续性,又通过计算考虑到了特征局部一致性。选择全局和局部区域的优势在于本实施例既可以确保整个空间区域的长期连续性,又可以确保当前要素通道周围的局部一致性。孔区域的边界与相邻图像内容统一,并且孔区域内的内容设置为一致。
在步骤S340中,基于均衡特征对图像特征进行图像重建,生成待处理图像对应的修复图像。
在本申请的一个实施例中,在生成均衡特征之后,基于均衡特征对图像特征进行图像重建和恢复。在本申请的一个实施例中,如图11所示,步骤S340中基于均衡特征对图像特征进行图像重建,生成待处理图像对应的修复图像的过程,包括如下步骤S341~S342,详细说明如下:
在步骤S341中,基于编码器生成的待处理图像对应于各特征级别的编码特征,通过编码器对应的解码器,对编码特征进行解码处理,得到各特征级别对应的图像特征;特征级别浅层卷积网络和深层卷积网络;
图12为本申请实施例提供的基于编码器和解码器过程的图像修复网络的示意图。
如图12所示,本实施例中编码器1220和解码器1250的结构是简化的生成网络。示例性的,本实施例中的编码器中有6个卷积层,解码器中有5个卷积层,此处数量仅为示意;同时,在编码器和解码器之间设置了具有扩张卷积的残差网络1230,可以由4个残差块组成。扩张卷积增加了感知编码器特征的接收域的大小。在编码器中,本实施例将深层的卷积特征重组为语义所在的结构特征。同时,本实施例将浅层的卷积特征重新组织为纹理特征,以表示图像细节。
本实施例中引入残差单元,使得编码器和解码器之间通过跳跃连接,基于编码器生成的待处理图像对应于各特征级别的编码特征,通过编码器对应的解码器,对编码特征进行解码处理,得到各特征级别对应的图像特征,以直接将输入信息绕道传到输出,保护信息的完整性,整个网络只需要学习输入与输出差别的那一部分,简化学习目标和难度,在一定程度上解决了信息传递的时候或多或少会存储在信息丢失、损耗等问题,同时还有导致梯度消失或者梯度爆炸,导致很深的网络无法训练等问题。进而在解码器端得到较为完整的图像特征。
需要说明的是,对于本实施例中的编码器和解码器中的卷积网络,其中的卷积层数量不做限定,层数较多的卷积可以提升特征提取的效果和精确性。
在步骤S342中,基于均衡特征对各特征级别对应的图像特征请继续参考图12所示,在通过加码器得到各特征级别对应的图像特征之后,通过残差网络使得编码器和解码器之间通过跳跃连接,基于得到各特征级别对应的图像特征,通过特征均衡1240的方式在各特征级别补充解码器的语义损失,以直接将输入信息绕道传到输出,进行图像重建,生成待处理图像对应的修复图像。
本实施例中的方式保护了信息的完整性,整个网络只需要学习输入与输出差别的那一部分,简化学习目标和难度,在一定程度上解决了信息传递的时候或多或少会存储在信息丢失、损耗等问题,以使图像特征图在解码器的作用下恢复成RGB图像,即修复图像。
示例性的,本实施例中的硬件执行环境可以为:在GPU上进行训练,GPU型号为RTX2080ti。在训练以及测试过程中,可以选用多卡GPU(RTX2080ti)进行。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的图像修复的方法。可以理解的是,装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。对于本申请装置实施例中未披露的细节,请参照本申请上述的图像修复的方法的实施例。
图13示出了根据本申请的一个实施例的图像修复的装置的框图。
参照图13所示,根据本申请的一个实施例的图像修复的装置1300,包括:提取单元1310,用于基于待处理图像中的图像特征,提取出待处理图像的纹理特征图和结构特征图;融合单元1320,用于将纹理特征图和结构特征图进行融合,得到融合特征图;确定单元1330,用于基于融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定融合特征图对应的均衡特征;重建单元1340,用于基于均衡特征对图像特征进行图像重建,生成待处理图像对应的修复图像。
在本申请的一些实施例中,基于前述方案,图像特征包括浅层特征图和深层特征图;提取单元1310包括:第一提取单元,用于通过编码器中的浅层卷积网络从待处理图像中提取浅层特征图,并对浅层特征图进行重组,生成纹理特征图;第二提取单元,用于通过编码器中的深层卷积网络从待处理图像中提取深层特征图,并对深层特征图进行重组,生成结构特征图。
在本申请的一些实施例中,基于前述方案,第一提取单元包括:第一调整单元,用于基于设定的图像大小,对各浅层特征图的大小进行调整,得到大小统一的目标浅层特征图;第一级联单元,用于将各目标浅层特征图进行级联,生成纹理特征图;
在本申请的一些实施例中,基于前述方案,第一提取单元包括:第二调整单元,用于基于设定的图像大小,对深层特征图的大小进行调整,得到大小统一的目标深层特征图;第二级联单元,用于将目标深层特征图进行级联,生成结构特征图。
在本申请的一些实施例中,基于前述方案,重建单元1340包括:特征解码单元,用于基于编码器生成的待处理图像对应于各特征级别的编码特征,通过编码器对应的解码器,对编码特征进行解码处理,得到各特征级别对应的图像特征;特征级别浅层卷积网络和深层卷积网络;图像重建单元,用于基于均衡特征对各特征级别对应的图像特征进行图像重建,生成待处理图像对应的修复图像。
在本申请的一些实施例中,基于前述方案,融合单元1320包括:第一填充单元,用于对纹理特征图进行特征填充,得到填充纹理特征图;第二填充单元,用于对结构特征图进行特征填充,得到填充结构特征图;第三级联单元,用于将填充纹理特征图和填充结构特征图进行级联,得到级联特征图;第一卷积单元,用于对级联特征图进行卷积,生成与待处理图像大小相同的融合特征图。
在本申请的一些实施例中,基于前述方案,第一填充单元包括:内核确定单元,用于基于纹理特征图的大小,确定进行特征填充时对应的各卷积内核大小;特征填充单元,用于基于各卷积内核大小,对纹理特征图进行特征填充,得到各填充特征;第四级联单元,用于对各填充特征进行级联,得到填充纹理特征图。
在本申请的一些实施例中,基于前述方案,图像修复的装置1300还包括:第一映射单元,用于将填充纹理特征图映射到第一彩色纹理图中;第一损失单元,用于基于待处理图像与第一彩色纹理图之间的像素差矩阵,生成第一损失参数;第一调整单元,用于基于第一损失参数调整纹理特征图在特征填充过程中的参数。
在本申请的一些实施例中,基于前述方案,图像修复的装置1300还包括:第二映射单元,用于将填充结构特征图映射到第二彩色结构图中;结构图像获取单元,用于获取待处理图像对应的结构图像;第二损失单元,用于基于结构图像与第二彩色结构图之间的像素差矩阵,生成第二损失参数;第二调整单元,用于基于第二损失参数调整结构特征图在特征填充过程中的参数。
在本申请的一些实施例中,基于前述方案,确定单元1330包括:展开单元,用于对融合特征图进行特征展开处理,得到各特征通道对应的特征值向量;第一确定单元,用于基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定相邻特征通道之间的特征相似度;第二确定单元,用于基于相邻的特征通道对应的特征值向量,通过高斯函数确定待处理图像中相邻特征通道对应的空间距离;第五级联单元,用于基于特征相似度和空间距离得到的级联矩阵,确定融合特征图对应的均衡特征。
在本申请的一些实施例中,基于前述方案,第一确定单元用于:对相邻的特征通道对应的特征值向量进行逐元素相乘运算,得到元素乘积;基于设定的归一化因子对元素乘积进行均值计算,得到相邻的特征通道之间的特征相似度。
在本申请的一些实施例中,基于前述方案,第二确定单元用于:基于相邻的特征通道之间的距离以及特征通道对应的特征值向量,通过高斯函数生成特征通道对应的调整距离;基于设定的归一化因子对调整距离进行均值计算,得到空间距离。
在本申请的一些实施例中,基于前述方案,第五级联单元,包括:对特征相似度和空间距离进行级联,生成级联矩阵;基于设定的卷积核对级联矩阵进行采样处理,生成均衡特征。
图14示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图14示出的电子设备的计算机系统1400仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图14所示,计算机系统1400包括中央处理单元(Central Processing Unit,CPU)1401,其可以根据存储在只读存储器(Read-Only Memory,ROM)1402中的程序或者从储存部分1408加载到随机访问存储器(Random Access Memory,RAM)1403中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1403中,还存储有系统操作所需的各种程序和数据。CPU 1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(Input/Output,I/O)接口1405也连接至总线1404。
以下部件连接至I/O接口1405:包括键盘、鼠标等的输入部分1406;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1407;包括硬盘等的储存部分1408;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1409。通信部分1409经由诸如因特网的网络执行通信处理。驱动器1410也根据需要连接至I/O接口1405。可拆卸介质1411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1410上,以便于从其上读出的计算机程序根据需要被安装入储存部分1408。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1409从网络上被下载和安装,和/或从可拆卸介质1411被安装。在该计算机程序被中央处理单元(CPU)1401执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (15)
1.一种图像修复的方法,其特征在于,包括:
基于待处理图像中的图像特征,提取出所述待处理图像的纹理特征图和结构特征图;
将所述纹理特征图和所述结构特征图进行融合,得到融合特征图;
基于所述融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定所述融合特征图对应的均衡特征;
基于所述均衡特征对所述图像特征进行图像重建,生成所述待处理图像对应的修复图像。
2.根据权利要求1所述的方法,其特征在于,所述图像特征包括浅层特征图和深层特征图;
基于待处理图像中的图像特征,提取出所述待处理图像的纹理特征图和结构特征图,包括:
通过编码器中的浅层卷积网络从所述待处理图像中提取浅层特征图,并对所述浅层特征图进行重组,生成所述纹理特征图;
通过编码器中的深层卷积网络从所述待处理图像中提取深层特征图,并对所述深层特征图进行重组,生成所述结构特征图。
3.根据权利要求2所述的方法,其特征在于,对所述浅层特征图进行重组,生成所述纹理特征图,包括:
基于设定的图像大小,对各所述浅层特征图的大小进行调整,得到大小统一的目标浅层特征图;
将各所述目标浅层特征图进行级联,生成所述纹理特征图;
对所述深层特征图进行重组,生成所述结构特征图,包括:
基于设定的图像大小,对所述深层特征图的大小进行调整,得到大小统一的目标深层特征图;
将所述目标深层特征图进行级联,生成所述结构特征图。
4.根据权利要求2所述的方法,其特征在于,基于所述均衡特征对所述图像特征进行图像重建,生成所述待处理图像对应的修复图像,包括:
基于所述编码器生成的所述待处理图像对应于各特征级别的编码特征,通过所述编码器对应的解码器,对所述编码特征进行解码处理,得到各特征级别对应的图像特征;所述特征级别浅层卷积网络和深层卷积网络;
基于所述均衡特征对所述各特征级别对应的图像特征进行图像重建,生成所述待处理图像对应的修复图像。
5.根据权利要求1所述的方法,其特征在于,将所述纹理特征图和所述结构特征图进行融合,得到融合特征图,包括:
对所述纹理特征图进行特征填充,得到填充纹理特征图;
对所述结构特征图进行特征填充,得到填充结构特征图;
将所述填充纹理特征图和所述填充结构特征图进行级联,得到级联特征图;
对所述级联特征图进行卷积,生成与所述待处理图像大小相同的融合特征图。
6.根据权利要求5所述的方法,其特征在于,对所述纹理特征图进行特征填充,得到填充纹理特征图,包括:
基于所述纹理特征图的大小,确定进行特征填充时对应的各卷积内核大小;
基于所述各卷积内核大小,对所述纹理特征图进行特征填充,得到各填充特征;
对所述各填充特征进行级联,得到填充纹理特征图。
7.根据权利要求5所述的方法,其特征在于,对所述纹理特征图进行特征填充,得到填充纹理特征图之后,还包括:
将所述填充纹理特征图映射到第一彩色纹理图中;
基于所述待处理图像与所述第一彩色纹理图之间的像素差矩阵,生成第一损失参数;
基于所述第一损失参数调整所述纹理特征图在特征填充过程中的参数。
8.根据权利要求5所述的方法,其特征在于,对所述结构特征图进行特征填充,得到填充结构特征图之后,还包括:
将所述填充结构特征图映射到第二彩色结构图中;
获取所述待处理图像对应的结构图像;
基于所述结构图像与所述第二彩色结构图之间的像素差矩阵,生成第二损失参数;
基于所述第二损失参数调整所述结构特征图在特征填充过程中的参数。
9.根据权利要求1所述的方法,其特征在于,基于所述融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定所述融合特征图对应的均衡特征,包括:
对所述融合特征图进行特征展开处理,得到各特征通道对应的特征值向量;
基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定所述相邻特征通道之间的特征相似度;
基于所述相邻的特征通道对应的特征值向量,通过高斯函数确定所述待处理图像中相邻特征通道对应的空间距离;
基于所述特征相似度和所述空间距离得到的级联矩阵,确定所述融合特征图对应的均衡特征。
10.根据权利要求9所述的方法,其特征在于,基于相邻的特征通道对应的特征值向量,通过逐元素相乘运算确定所述相邻特征通道之间的特征相似度,包括:
对所述相邻的特征通道对应的特征值向量进行逐元素相乘运算,得到元素乘积;
基于设定的归一化因子对所述元素乘积进行均值计算,得到所述相邻的特征通道之间的特征相似度。
11.根据权利要求9所述的方法,其特征在于,基于所述相邻的特征通道对应的特征值向量,通过高斯函数确定所述待处理图像中相邻特征通道对应的空间距离,包括:
基于所述相邻的特征通道之间的距离以及所述特征通道对应的特征值向量,通过高斯函数生成所述特征通道对应的调整距离;
基于设定的归一化因子对所述调整距离进行均值计算,得到所述空间距离。
12.根据权利要求9所述的方法,其特征在于,基于所述特征相似度和所述空间距离得到的级联矩阵,确定所述融合特征图对应的均衡特征,包括:
对所述特征相似度和所述空间距离进行级联,生成级联矩阵;
基于设定的卷积核对所述级联矩阵进行采样处理,生成所述均衡特征。
13.一种图像修复的装置,其特征在于,包括:
提取单元,用于基于待处理图像中的图像特征,提取出所述待处理图像的纹理特征图和结构特征图;
融合单元,用于将所述纹理特征图和所述结构特征图进行融合,得到融合特征图;
确定单元,用于基于所述融合特征图中相邻特征通道之间的空间距离、以及相邻特征通道之间的特征相似度,确定所述融合特征图对应的均衡特征;
重建单元,用于基于所述均衡特征对所述图像特征进行图像重建,生成所述待处理图像对应的修复图像。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的图像修复的方法。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至12中任一项所述的图像修复的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010995966.9A CN112132770A (zh) | 2020-09-21 | 2020-09-21 | 图像修复的方法、装置、计算机可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010995966.9A CN112132770A (zh) | 2020-09-21 | 2020-09-21 | 图像修复的方法、装置、计算机可读介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132770A true CN112132770A (zh) | 2020-12-25 |
Family
ID=73841775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010995966.9A Pending CN112132770A (zh) | 2020-09-21 | 2020-09-21 | 图像修复的方法、装置、计算机可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132770A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113538273A (zh) * | 2021-07-13 | 2021-10-22 | 荣耀终端有限公司 | 图像处理方法及图像处理装置 |
CN113572913A (zh) * | 2021-01-18 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像加密方法、装置、介质及电子设备 |
CN113642415A (zh) * | 2021-07-19 | 2021-11-12 | 南京南瑞信息通信科技有限公司 | 人脸特征表达方法及人脸识别方法 |
CN114782282A (zh) * | 2022-04-29 | 2022-07-22 | 武汉大学 | 一种图像修复方法、装置、设备及可读存储介质 |
CN114943656A (zh) * | 2022-05-31 | 2022-08-26 | 山东财经大学 | 一种人脸图像修复方法及系统 |
CN117474806A (zh) * | 2023-12-26 | 2024-01-30 | 松立控股集团股份有限公司 | 一种基于全局结构编码的全景图像修复方法 |
CN118334611A (zh) * | 2024-06-13 | 2024-07-12 | 成都航空职业技术学院 | 一种基于深度学习的多模态图像数据实时融合方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782395A (zh) * | 2019-10-28 | 2020-02-11 | 西安电子科技大学 | 图像处理方法及装置、电子设备和计算机可读存储介质 |
CN111242097A (zh) * | 2020-02-27 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 一种人脸识别方法、装置、计算机可读介质及电子设备 |
-
2020
- 2020-09-21 CN CN202010995966.9A patent/CN112132770A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782395A (zh) * | 2019-10-28 | 2020-02-11 | 西安电子科技大学 | 图像处理方法及装置、电子设备和计算机可读存储介质 |
CN111242097A (zh) * | 2020-02-27 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 一种人脸识别方法、装置、计算机可读介质及电子设备 |
Non-Patent Citations (1)
Title |
---|
HONGYU LIU: "Rethinking Image Inpainting via a Mutual Encoder-Decoder with Feature Equalizations", HTTPS://DOI.ORG/10.48550/ARXIV.2007.06929, 14 July 2020 (2020-07-14), pages 1 - 16 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113572913A (zh) * | 2021-01-18 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像加密方法、装置、介质及电子设备 |
CN113572913B (zh) * | 2021-01-18 | 2022-08-05 | 腾讯科技(深圳)有限公司 | 图像加密方法、装置、介质及电子设备 |
CN113538273A (zh) * | 2021-07-13 | 2021-10-22 | 荣耀终端有限公司 | 图像处理方法及图像处理装置 |
CN113538273B (zh) * | 2021-07-13 | 2023-09-19 | 荣耀终端有限公司 | 图像处理方法及图像处理装置 |
CN113642415B (zh) * | 2021-07-19 | 2024-06-04 | 南京南瑞信息通信科技有限公司 | 人脸特征表达方法及人脸识别方法 |
CN113642415A (zh) * | 2021-07-19 | 2021-11-12 | 南京南瑞信息通信科技有限公司 | 人脸特征表达方法及人脸识别方法 |
CN114782282A (zh) * | 2022-04-29 | 2022-07-22 | 武汉大学 | 一种图像修复方法、装置、设备及可读存储介质 |
CN114782282B (zh) * | 2022-04-29 | 2024-11-15 | 武汉大学 | 一种图像修复方法、装置、设备及可读存储介质 |
CN114943656B (zh) * | 2022-05-31 | 2023-02-28 | 山东财经大学 | 一种人脸图像修复方法及系统 |
CN114943656A (zh) * | 2022-05-31 | 2022-08-26 | 山东财经大学 | 一种人脸图像修复方法及系统 |
CN117474806B (zh) * | 2023-12-26 | 2024-04-12 | 松立控股集团股份有限公司 | 一种基于全局结构编码的全景图像修复方法 |
CN117474806A (zh) * | 2023-12-26 | 2024-01-30 | 松立控股集团股份有限公司 | 一种基于全局结构编码的全景图像修复方法 |
CN118334611A (zh) * | 2024-06-13 | 2024-07-12 | 成都航空职业技术学院 | 一种基于深度学习的多模态图像数据实时融合方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112132770A (zh) | 图像修复的方法、装置、计算机可读介质及电子设备 | |
CN111488865B (zh) | 图像优化方法、装置、计算机存储介质以及电子设备 | |
CN111047548B (zh) | 姿态变换数据处理方法、装置、计算机设备和存储介质 | |
CN111901598B (zh) | 视频解码与编码的方法、装置、介质及电子设备 | |
Fu et al. | Ppt fusion: Pyramid patch transformerfor a case study in image fusion | |
CN110659723B (zh) | 基于人工智能的数据处理方法、装置、介质及电子设备 | |
KR102311796B1 (ko) | 지역적 신체영역 정보를 이용한 휴먼 모션 디블러링 방법 및 장치 | |
CN111915618B (zh) | 基于峰值响应增强的实例分割算法、计算设备 | |
CN111950700A (zh) | 一种神经网络的优化方法及相关设备 | |
JP2023545189A (ja) | 画像処理方法、装置、及び電子機器 | |
CN115205150A (zh) | 图像的去模糊方法、装置、设备、介质及计算机程序产品 | |
CN115222917A (zh) | 三维重建模型的训练方法、装置、设备及存储介质 | |
CN114612902A (zh) | 图像语义分割方法、装置、设备、存储介质及程序产品 | |
CN117218300A (zh) | 三维模型的构建方法、三维构建模型的训练方法及装置 | |
CN112990215A (zh) | 图像去噪方法、装置、设备及存储介质 | |
CN114494395B (zh) | 基于平面先验的深度图生成方法、装置、设备及存储介质 | |
Wang et al. | DFC-dehaze: an improved cycle-consistent generative adversarial network for unpaired image dehazing | |
CN117934478B (zh) | 缺陷检测方法、装置、设备及介质 | |
CN118229632B (zh) | 显示屏缺陷检测方法、模型训练方法、装置、设备及介质 | |
CN116258756B (zh) | 一种自监督单目深度估计方法及系统 | |
CN112085680A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN117392297A (zh) | 三维模型重建方法、装置、设备及存储介质 | |
CN114612901B (zh) | 图像变化识别方法、装置、设备和存储介质 | |
Zhuang et al. | Dimensional transformation mixer for ultra-high-definition industrial camera dehazing | |
CN117011740A (zh) | 视频检测方法和装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40035763 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |