WO2023174416A1

WO2023174416A1 - 视频的超分辨率方法及装置

Info

Publication number: WO2023174416A1
Application number: PCT/CN2023/082228
Authority: WO
Inventors: 董航
Original assignee: 北京字节跳动网络技术有限公司
Priority date: 2022-03-17
Filing date: 2023-03-17
Publication date: 2023-09-21
Also published as: CN116797452A

Abstract

本公开实施例提供了一种视频的超分辨率方法及装置，涉及图像处理技术领域。该方法包括：分别将待超分视频的第t个图像帧和第t个图像帧的邻域图像帧分解为N个图像块；生成N个图像块序列，图像块序列中的各个图像块分别位于不同图像帧的相同位置；计算各个图像块序列的运动参数；图像块序列的运动参数包括该图像块序列中各个相邻图像帧的图像块之间的运动参数；根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；采用对应的超分网络模型对各个图像块序列中的第t个图像帧的图像块进行超分，获取第t个图像帧的各个超分图像块；根据第t个图像帧的各个超分图像块生成第t个图像帧的超分图像帧。

Description

视频的超分辨率方法及装置

相关申请的交叉引用

本公开是以中国申请号为202210265124.7，申请日为2022年03月17日的申请为基础，并主张其优先权，该中国申请的公开内容在此作为整体引入本公开中。

技术领域

本公开涉及图像处理技术领域，尤其涉及一种视频的超分辨率方法及装置。

背景技术

视频的超分辨率技术又称为视频超分技术，是一种由低分辨率视频恢复出高分辨率视频的技术。由于视频超分辨率业务目前已成为视频画质增强中的重点业务，因此视频超分技术是当前图像处理领域的研究热点之一。

近年来，随着深度学习技术的发展，基于深度学习神经网络的视频超分网络模型实现了许多突破，包括更好的超分效果以及更好的实时性。目前，主流的滑动窗口型视频超分网络模型均是利用视频的大多数图像帧都处于运动之中，在对视频中的每一个图像帧进行超分时，其邻域图像帧都可以提供大量的时域信息以供视频超分网络模型对当前图像帧进行超分。

发明内容

第一方面，本公开的实施例提供了一种视频的超分辨率方法，包括：

分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块；t、N均为正整数；

根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置；

计算各个图像块序列的运动参数；任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流；

根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；

采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块；

根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。

第二方面，本公开的实施例提供了一种视频的超分辨率装置，包括：

图像分解模块，用于分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块；t、N均为正整数序列生成模块，用于根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置；

参数计算模块，用于计算各个图像块序列的运动参数；任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流；

模型确定模块，用于根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；

图像超分模块，用于采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块；

图像生成模块，根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。

第三方面，本公开实施例提供了一种电子设备，包括：存储器和处理器，所述存储器用于存储计算机程序；所述处理器用于在调用计算机程序时，使得所述电子设备实现第一方面或第一方面任一种可选的实施方式所述的视频的超分辨率方法。

第四方面，本公开实施例提供一种计算机可读存储介质，当所述计算机程序被计算设备执行时，使得所述计算设备实现第一方面或第一方面任一种可选的实施方式所述的视频的超分辨率方法。

第五方面，本公开实施例提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现第一方面或第一方面任一种可选的实施方式所述的视频的超分辨率方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的视频的超分辨率方法的步骤流程图；

图2为本公开实施例提供的图像帧分解得到的图像块的示意图；

图3为本公开实施例提供的图像块序列的示意图；

图4为本公开实施例提供的图像块方式的示意图；

图5为本公开实施例提供的实现超分辨率方法的模型的示意图；

图6为本公开实施例提供的自适应超分模块的示意图；

图7为本公开实施例提供的第一超分网络模型的示意图；

图8为本公开实施例提供的第二超分网络模型的示意图；

图9为本公开实施例提供的第三超分网络模型的示意图；

图10为本公开实施例提供的视频的超分辨率装置的示意图；

图11为本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

需要说明的是，为了便于清楚描述本公开实施例的技术方案，在本公开的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。例如：第一特征图像集合和第二特征图像集合仅仅是为了区分不同的特征图像集合，而不是在对特征图像集合的顺序等进行限定。

在本公开实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外，在本公开实施例的描述中，除非另有说明，“多个”的含义是指两个或两个以上。

相关技术中，滑动窗口型视频超分网络模型均是利用视频的大多数图像帧都处于运动之中，在对视频中的每一个图像帧进行超分时，其邻域图像帧都可以提供大量的时域信息以供视频超分网络模型对当前图像帧进行超分。然而，在一些视频中部分区域始终为静止的物体或背景，在对这类视频进行超分时，由于静止的物体或背景带来的时域冗余信息，采用邻域图像帧作为输入常常无法获取较为理想的视频超分效果，甚至超分效果不及基于单个图像帧进行超分的超分效果。综上，当视频中存在时域冗余信息时，如何提升视频的超分效果是一个亟待解决的问题。

有鉴于此，本公开提供了一种视频的超分辨率方法及装置，用于提升视频的超分辨率效果。

本公开实施例提供了一种视频的超分辨率方法，参照图1所示的步骤流程图，本公开实施例提供的视频的超分辨率方法包括如下步骤S11至S16：

S11、分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块。

其中，t、N均为正整数。

在一些实施例中，将任一图像帧分解为N个图像块的实现方式包括：通过尺寸为一个图像块的尺寸的采样窗口，从该图像帧的第一像素点开始以预设步长滑动对该图像帧的各个位置进行采样，并将采样窗口的每一个采样区域作为一个图像块，从而将该图像帧分解为N个图像块。

示例性的，参照图2所示，待超分视频的第t个图像帧包括1024*512个像素点，当采样窗口的尺寸为72*72、步长为64时，可以将待超分视频的第t个图像帧分解为16*8个图像块，每一个图像块包括72*72个像素点，且相邻图像块之间具有重叠区域，重叠区域的宽度为8个像素点。

S12、根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列。

其中，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置。

示例性的，参照图3所示，所述第t个图像帧33的邻域图像帧包括：第t-2个图像帧31、第t-1个图像帧32、第t+1个图像帧34以及第t+2个图像帧35为例示出。每一个图像库序列中包括5个图像块，该5个图像块分别为第t-2个图像帧31、第t-1个图像帧32、第t个图像帧33、第t+1个图像帧34以及第t+2个图像帧35的图像块，且位于同一图像块序列中的各个图像块在各自所属的图像帧中的位置相同。

S13、计算各个图像块序列的运动参数。

其中，任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流。

示例性的，图像块序列包括：第t-2个图像帧的图像块第t-1个图像帧的图像块第t个图像帧的图像块第t+1个图像帧的图像块以及第t+2个图像帧的图像块则图像块序列的运动参数用于表征图像块与图像块之间的光流、图像块与图像块之间的光流、图像块与图像块之间的光流以及图像块与图像块之间的光流。

作为本公开实施例一种可选的实施方式，所述计算各个图像块序列的运动参数，包括针对每一个图像块序列执行如下步骤a至步骤c：

步骤a、计算所述图像块序列中各个相邻图像帧的图像块之间的光流。

承上所述，图像块序列包括：第t-2个图像帧的图像块第t-1个图像帧的图像块第t个图像帧的图像块第t+1个图像帧的图像块以及第t+2个图像帧的图像块则计算图像块与图像块之间的光流、图像块与图像块之间的光流、图像块与图像块之间的光流以及图像块与图像块之间的光流。

示例性的，可以基于稠密逆搜索(Dense Inverse Search，DIS)光流算法计算所述图像块序列中各个相邻图像帧的图像块之间的光流。

步骤b、针对每一对相邻图像帧的图像块之间的光流，计算各个像素点对应的光流的绝对值的平均值，获取所述相邻图像帧的图像块之间的运动参数。

将图像块序列中相邻图像帧的图像块之间的运动参数表示为：光流算法表示为f(…)、对各个像素点对应的光流求平均值求表示为mean(…)、求绝对值表示为|…|，则有：

例如，图像块与图像块之间的运动参数为：

再例如，图像块与图像块之间的运动参数为：

S14、根据各个图像块序列的运动参数，确定各个图像块序列对应的超分网络模型。

作为本公开实施例一种可选的实施方式，所述第t个图像帧的邻域图像帧，包括第t-2个图像帧、第t-1个图像帧、第t+1个图像帧以及第t+2个图像帧，上述步骤S14(根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型)包括针对每一个图像块序列执行如下步骤1至步骤5：

步骤1、确定所述图像块序列的第一运动参数和第二运动参数是否均小于预设阈值。

其中，所述第一运动参数为所述第t个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第二运动参数为所述第t个图像帧的图像块与所述第t+1个图像帧的图像块之间的运动参数。

设：第t个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数为第t+1个图像帧的图像块与所述第t个图像帧的图像块之间的运动参数为预设阈值为γ，则上述步骤1为分别判断和是否小于γ。

在上述步骤1中，若所述第一运动参数和所述第二运动参数均小于所述预设阈值，则执行如下步骤2。

步骤2、确定所述图像块序列对应的超分网络模型为第一超分网络模型。

作为本公开实施例一种可选的实施方式，所述第一超分网络模型为单帧超分网络模型。

在上述步骤1中，若所述第一运动参数和/或所述第二运动参数大于或等于所述预设阈值，则执行如下步骤3。

步骤3、确定所述图像块序列的第三运动参数和第四运动参数是否均小于预设阈值。

其中，所述第三运动参数为所述第t-2个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第四运动参数为所述第t+1个图像帧的图像块与所述第t+2个图像帧的图像块之间的运动参数。

设：第t-2个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数为第t+1个图像帧的图像块与所述第t+2个图像帧的图像块之间的运动参数为预设阈值为γ，则上述步骤3为分别判断和是否小于γ。

在上述步骤3中，若所述第三运动参数和所述第四运动参数均小于所述预设阈值，则执行如下步骤4。

步骤4、确定所述图像块序列对应的超分网络模型为第二超分网络模型。

作为本公开实施例一种可选的实施方式，所述第二超分网络模型用于基于所述第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块，对所述第t个图像帧的图像块进行超分。

在上述步骤3中，若所述第三运动参数和/或所述第四运动参数大于或等于所述预设阈值，则执行如下步骤5。

步骤5、确定所述图像块序列对应的超分网络模型为第三超分网络模型。

作为本公开实施例一种可选的实施方式，所述第三超分网络模型用于基于图像块序列中的所有图像块对所述第t个图像帧的图像块进行超分。

设：第t个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数为第t+1个图像帧的图像块与所述第t个图像帧的图像块之间的运动参数为第t-2个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数为第t+1个图像帧的图像块与所述第t+2个图像帧的图像块之间的运动参数为预设阈值为γ。第一超分网络模型为第二超分网络模型为第三超分网络模型为则上述步骤1至5可以表示如下：

S15、采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块。

具体的，由于根据每一个图像块序列均可以获取一个所述第t个图像帧的超分图像块，且共包括N个图像块序列，因此共可以获取N个所述第t个图像帧的超分图像块。

S16、根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。

作为本公开实施例一种可选的实施方式，当分解所述第t个图像帧和所述邻域图像帧得到的图像块中的相邻图像块不具有重叠区域的情况下，上述步骤S16(根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧)包括：

将所述第t个图像帧的各个超分图像块拼接为所述第t个图像帧的超分图像帧。

作为本公开实施例一种可选的实施方式，当分解所述第t个图像帧和所述邻域图像帧得到的图像块中相邻图像块具有重叠区域的情况下，上述步骤S16(根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧)包括：

拼接所述第t个图像帧的各个超分图像块，生成拼接图像；

将所述拼接图像中各个超分图像块的重叠区域的各个像素点的像素值设置为各个超分图像块中对应的像素点的像素值的平均值，生成所述第t个图像帧的超分图像帧。

示例性的，参照图4所示，图4中的超分图像块41的起始像素列为第P列，超分图像块41的终止像素列为第P+m列，超分图像块42的起始像素列为第P+n列，超分图像块42的终止像素列为第P+m+n列，对超分图像块41和超分图像块42进行拼接时，超分图像块41的区域411会与超分图像块42的区域421重叠，则因此重叠区域400的任一像素点的像素值为区域411与区域421中对应该像素点的像素值的平均值。例如：对于重叠区域400中的像素点(x1，y1)的像素值，为区域411中像素点(x1，y1)的像素值与区域412中像素点(x1，y1)的像素值的平均值。

参照图5所示，图5为用于实现上述视频超分方法的视频超分网络的结构示意图。用于实现上述视频超分方法的视频超分网络包括：图像分解模块51、序列生成模块52、冗余信息检测模块53、自适应超分模块54以及图像拼接模块55。

其中，图像分解模块51用于将第t-2个图像帧I_t-2分解为N个图像块将第t-1个图像帧I_t-1分解为N个图像块将第t个图像帧I_t分解为N个图像块将第t+1个图像帧I_t+1分解为N个图像块将第t个图像帧I_t+2分解为N个图像块

序列生成模块52用于根据生成N个图像块序列

冗余信息监测模块53用于计算各个图像块序列的运动参数，并根据各个图像块序列的运动参数，确定各个图像块序列的超分网络模型

自适应超分模块54包括各个图像块序列对应的超分网络模型，用于采用各个图像块序列对应的超分网络模型，对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块

图像拼接模块55用于根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧O_t。

本公开实施例提供的视频的超分辨率方法在对第t个图像帧图像进行超分时，首先分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块，并根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，然后计算各个图像块序列的运动参数，以及根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型，再根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型，采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块，以及根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。由于本公开实施例提供的视频的超分辨率方法在对第t个图像帧图像进行超分时，可以根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型，并针对不同情况适应性的采用不同的超分网络模型进行超分，因此本公开实施例提供的视频的超分辨率方法可以提升视频的超分辨率效果。

示例性的，参照图6所示，图5所示自适超分模块54中包括第一超分网络模型541、第二超分网络模型542以及第三超分网络模型543。其中，第一超分网络模型541在对所述第t个图像帧的图像块进行超分时会使用第t个图像帧的图像块第二超分网络模型542在对所述第t个图像帧的图像块进行超分时会使用第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块第三超分网络模型543在对所述第t个图像帧的图像块进行超分时会使用图像块序列中的所有图像块

作为本公开实施例一种可选的实施方式，参照图7所示的第一超分网络模型的模型结构示意图所示，通过第一超分网络模型对所述第t个图像帧的图像块进行超分的实现方式包括如下步骤Ⅰ至步骤Ⅳ：

步骤Ⅰ、通过级联可形变卷积(Pyramid Cascading and Deformable Convolutions)PCD对齐模块71对所述第t个图像帧的图像块进行处理获取第一特征T₁。

参照图7所示，PCD对齐模块71的输入为两个图像块，而上述步骤Ⅰ中PCD对齐模块的输入仅包括一个图像块(第t个图像帧的图像块)，因此可以将第t个图像帧的图像块复制一份，并与原图像块共同作为PCD对齐模块的输入。

步骤Ⅱ、通过特征融合模块72对所述第一特征进行处理，获取第二特征T₂。

其中，所述第二特征为将五个所述第一特征在通道维度上拼接得到的特征。本领域技术人员应当知晓，第二特征可以是多个所述第一特征在通道维度上拼接得到的特征，在此对用于拼接的第一特征的数量不做限制。

即，设第一特征的张量为C*H*W，则第二特征的张量为5*C*H*W。其中，C为第一特征的通道数、H为第一特征的长度、W为第一特征的宽度。

示例性的，参照图7所示，特征融合模块72可以包括时间注意力单元721、特征复制单元722、特征融合单元723以及空间注意力单元724。其中，特征复制单元722用于将第一特征复制4次，并与原第一特征进行拼接。

步骤Ⅲ、通过重建模块73对所述第二特征T₂进行重建，获取第一图像块B₁。

步骤Ⅳ、通过上采样模块74对所述第一图像块B₁进行上采样，获取所述第t个图像帧的图像块对应的超分图像块

作为本公开实施例一种可选的实施方式，参照图8所示的第二超分网络模型的模型结构示意图所示，通过第二超分网络模型对所述第t个图像帧的图像块进行超分的实现方式包括如下步骤ⅰ至步骤ⅳ：

步骤ⅰ、对通过PCD对齐模块81对所述第t-1个图像帧的图像块所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块进行处理，获取第三特征T₃。

其中，所述第三特征T₃为将第四特征T₄、第五特征T₅以及第六特征T₆在通道维度上拼接得到的特征，所述第四特征T₄为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第五特征T₅为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第六特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征。

参照图8所示，PCD对齐模块81包括第一PCD对齐单元811、第二PCD对齐单元812、第三PCD对齐单元813以及拼接单元814。其中，第一PCD对齐单元811用于对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理，获取第四特征T₄；第二PCD对齐单元812用于对第t个图像帧的图像块进行处理，获取第五特征T₅；第三PCD对齐单元813用于对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理，获取第五特征T₆；拼接单元814用于拼接第四特征T₄、第五特征T₅以及第六特征T₆，获取第三特征T₃。

步骤ⅱ、通过特征融合模块82对所述第三特征T₃进行处理，获取第七特征T₇。

其中，所述第七特征T₇为所第四特征T₄、所述第三特征T₃以及所述第五特征T₅在通道维度上拼接得到的特征。

示例性的，参照图8所示，特征融合模块82可以包括时间注意力单元821、特征复制单元822、特征融合单元823以及空间注意力单元824。其中特征复制单元822用于将所述第三特征T₃中的所第四特征T₄和第五特征T₅复制一次，并与第三特征T₃进行拼接。

步骤ⅲ、通过重建模块83对所述第七特征T₇进行重建，获取第二图像块B₂。

步骤ⅳ、通过上采样模块84对所述第二图像块B₂进行上采样，获取所述第t个图像帧的图像块对应的超分图像块

作为本公开实施例一种可选的实施方式，参照图9所示的第三超分网络模型的模型结构示意图所示，通过第三超分网络模型对图像块序列中的所述第t个图像帧的图像块进行超分包括如下步骤①至步骤④：

步骤①、对通过PCD对齐模块91对图像块序列中的全部图像块进行处理，获取第八特征T₈。

其中，所述第八特征T₈为将第九特征T₉、第十特征T₁₀、第十一特征T₁₁、第十二特征T₁₂以及第十三特征T₁₃在通道维度上拼接得到的特征，所述第九特征T₉为通过所述PCD对齐模块对所述第t-2个图像帧的图像块和所述第t-1个图像帧的图像块进行处理得到的特征，所述第十特征为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第十一特征为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第十二特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征，所述第十三特征为通过所述PCD对齐模块对所述第t+1个图像帧的图像块和所述第t+2个图像帧的图像块进行处理得到的特征。

示例性的，参照图9所示，PCD对齐模块91包括第一PCD对齐单元911、第二PCD对齐单元912、第三PCD对齐单元913，第四PCD对齐单元914、第五PCD对齐单元915以及拼接单元916。第一PCD对齐单元911用于对所述第t-2个图像帧的图像块和所述第t-1个图像帧的图像块进行处理，获取第九特征T₉；第二PCD对齐单元912用于对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理，获取第十特征T₁₀；第三PCD对齐单元913用于对第t个图像帧的图像块进行处理，获取第十一特征T₁₁；第四PCD对齐单元915用于对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理，获取第十二特征T₁₂；第五PCD对齐单元915用于对所述第t+1个图像帧的图像块和所述第t+2个图像帧的图像块进行处理，获取第十三特征T₁₃；拼接单元916用于拼接第九特征T₉、第十特征T₁₀、第十一特征T₁₁、第十二特征T₁₂以及第十三特征T₁₃，获取第八特征T₈。

步骤②、通过特征融合模块92对所述第八特征T₈进行处理，获取第十四特征T₁₄。

示例性的，参照图9所示，特征融合模块92可以包括时间注意力单元921、特征融合单元922以及空间注意力单元923。

步骤③、通过重建模块93对所述第十四特征T₁₄进行重建，获取第三图像块B₃。

步骤④、通过上采样模块94对所述第三图像块B₃进行上采样，获取图像块序列中的所述第t个图像帧的图像块对应的超分图像块

基于同一发明构思，作为对上述方法的实现，本公开实施例还提供了一种视频的超分辨率装置，该装置实施例与前述方法实施例对应，为便于阅读，本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述，但应当明确，本实施例中的视频的超分辨率装置能够对应实现前述方法实施例中的全部内容。

本公开实施例提供了一种视频的超分辨率装置，图10为该视频的超分辨率装置的结构示意图，如图10所示，该视频的超分辨率装置100包括：

图像分解模块101，用于分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块；t、N均为正整数；

序列生成模块102，用于根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置；

参数计算模块103，用于计算各个图像块序列的运动参数；任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流；

模型确定模块104，用于根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；

图像超分模块105，用于采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块；

图像生成模块106，根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。

作为本公开实施例一种可选的实施方式，所述参数计算模块103，具体用于针对每一个图像块序列，计算所述图像块序列中各个相邻图像帧的图像块之间的光流；针对每一对相邻图像帧的图像块之间的光流，计算各个像素点对应的光流的绝对值的平均值，获取所述相邻图像帧的图像块之间的运动参数；根据所述图像块序列中各个相邻图像帧的图像块之间的运动参数，获取所述图像块序列的运动参数。

作为本公开实施例一种可选的实施方式，所述第t个图像帧的邻域图像帧，包括：

所述待超分视频的第t-2个图像帧、第t-1个图像帧、第t+1个图像帧以及第t+2个图像帧。

作为本公开实施例一种可选的实施方式，所述模型确定模块104，具体用于针对每一个图像块序列，确定所述图像块序列的第一运动参数和第二运动参数是否均小于预设阈值；所述第一运动参数为所述第t个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第二运动参数为所述第t个图像帧的图像块与所述第t+1个图像帧的图像块之间的运动参数；若所述第一运动参数和所述第二运动参数均小于所述预设阈值，则确定所述图像块序列对应的超分网络模型为第一超分网络模型；若所述第一运动参数和/或所述第二运动参数大于或等于所述预设阈值，则确定所述图像块序列的第三运动参数和第四运动参数是否均小于预设阈值；所述第三运动参数为所述第t-2个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第四运动参数为所述第t+1个图像帧的图像块与所述第t+2个图像帧的图像块之间的运动参数；若所述第三运动参数和所述第四运动参数均小于所述预设阈值，则确定所述图像块序列对应的超分网络模型为第二超分网络模型；若所述第三运动参数和/或所述第四运动参数大于或等于所述预设阈值，则确定所述图像块序列对应的超分网络模型为第三超分网络模型。

作为本公开实施例一种可选的实施方式，

所述第一超分网络模型为单帧超分网络模型；

所述第二超分网络模型用于基于所述第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块，对所述第t个图像帧的图像块进行超分；

所述第三超分网络模型用于基于图像块序列中的所有图像块对所述第t个图像帧的图像块进行超分。

作为本公开实施例一种可选的实施方式，所述图像超分模块105，具体用于通过级联可形变卷积PCD对齐模块对所述第t个图像帧的图像块进行处理获取第一特征；通过特征融合模块对所述第一特征进行处理，获取第二特征，所述第二特征为将五个所述第一特征在通道维度上拼接得到的特征；通过重建模块对所述第二特征进行重建，获取第一图像块；通过上采样模块对所述第一图像块进行上采样，获取所述第t个图像帧的图像块对应的超分图像块。

作为本公开实施例一种可选的实施方式，所述图像超分模块105，具体用于对通过PCD对齐模块对所述第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块进行处理，获取第三特征；所述第三特征为将第四特征、第五特征以及第六特征在通道维度上拼接得到的特征，所述第四特征为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第五特征为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第六特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征；通过特征融合模块对所述第三特征进行处理，获取第七特征，所述第七特征为所第四特征、所述第三特征以及所述第五特征在通道维度上拼接得到的特征；通过重建模块对所述第七特征进行重建，获取第二图像块；通过上采样模块对所述第二图像块进行上采样，获取所述第t个图像帧的图像块对应的超分图像块。

作为本公开实施例一种可选的实施方式，所述图像超分模块105，具体用于对通过PCD对齐模块对图像块序列中的全部图像块进行处理，获取第八特征；所述第八特征为将第九特征、第十特征、第十一特征、第十二特征以及第十三特征在通道维度上拼接得到的特征，所述第九特征为通过所述PCD对齐模块对所述第t-2个图像帧的图像块和所述第t-1个图像帧的图像块进行处理得到的特征，所述第十特征为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第十一特征为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第十二特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征，所述第十三特征为通过所述PCD对齐模块对所述第t+1个图像帧的图像块和所述第t+2个图像帧的图像块进行处理得到的特征；通过特征融合模块对所述第八特征进行处理，获取第十四特征；通过重建模块对所述第十四特征进行重建，获取第三图像块；通过上采样模块对所述第三图像块进行上采样，获取图像块序列中的所述第t个图像帧的图像块对应的超分图像块。

作为本公开实施例一种可选的实施方式，分解所述第t个图像帧和所述邻域图像帧得到的图像块中相邻图像块具有重叠区域；

所述图像生成模块106，具体用于拼接所述第t个图像帧的各个超分图像块，生成拼接图像；将所述拼接图像中各个超分图像块的重叠区域的各个像素点的像素值设置为各个超分图像块中对应的像素点的像素值的平均值，生成所述第t个图像帧的超分图像帧。

上述模块可以被实现为在一个或多个通用处理器上执行的软件组件，也可以被实现为诸如执行某些功能或其组合的硬件，诸如可编程逻辑设备和/或专用集成电路。在一些实施例中，这些模块可以体现为软件产品的形式，该软件产品可以存储在非易失性存储介质中，这些非易失性存储介质中包括使得计算机设备(例如个人计算机、服务器、网络设备、移动终端等)实现本公开实施例中描述的方法。在另一些实施例中，上述模块还可以在单个设备上实现，也可以分布在多个设备上。这些模块的功能可以相互合并，也可以进一步拆分为多个子模块。

本实施例提供的视频的超分辨率装置可以执行上述方法实施例提供的视频的超分辨率方法，其实现原理与技术效果类似，此处不再赘述。

基于同一发明构思，本公开实施例还提供了一种电子设备。图11为本公开实施例提供的电子设备的结构示意图，如图11所示，本实施例提供的电子设备包括：存储器111和处理器112，所述存储器111用于存储计算机程序；所述处理器112用于在调用计算机程序时执行上述实施例提供的视频的超分辨率方法。

基于同一发明构思，本公开实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当计算机程序被处理器执行时，使得所述计算设备实现上述实施例提供的视频的超分辨率方法。

基于同一发明构思，本公开实施例还提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算设备实现上述实施例提供的视频的超分辨率方法。

基于同一发明构思，本公开实施例还提供了一种计算机程序，包括指令，指令当由处理器执行时使处理器执行上述实施例提供的视频的超分辨率方法。

本领域技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储，信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。根据本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

最后应说明的是：以上各实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述各实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

Claims

一种视频的超分辨率方法，包括：

分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块，其中，t、N均为正整数；

根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，其中，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置；

计算各个图像块序列的运动参数，其中，任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流；

根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；

采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块；

根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。
根据权利要求1所述的视频的超分辨率方法，其中，所述计算各个图像块序列的运动参数，包括：

针对每一个图像块序列，计算所述图像块序列中各个相邻图像帧的图像块之间的光流；

针对每一对相邻图像帧的图像块之间的光流，计算各个像素点对应的光流的绝对值的平均值，获取所述相邻图像帧的图像块之间的运动参数；

根据所述图像块序列中各个相邻图像帧的图像块之间的运动参数，获取所述图像块序列的运动参数。
根据权利要求1或2所述的视频的超分辨率方法，其中，所述第t个图像帧的邻域图像帧，包括：

第t-2个图像帧、第t-1个图像帧、第t+1个图像帧以及第t+2个图像帧。
根据权利要求3所述的视频的超分辨率方法，其中，所述根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型，包括：

针对每一个图像块序列，确定所述图像块序列的第一运动参数和第二运动参数是否均小于预设阈值，其中，所述第一运动参数为所述第t个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第二运动参数为所述第t个图像帧的图像块与所述第t+1个图像帧的图像块之间的运动参数；

在所述第一运动参数和所述第二运动参数均小于所述预设阈值的情况下，确定所述图像块序列对应的超分网络模型为第一超分网络模型；

在所述第一运动参数和/或所述第二运动参数大于或等于所述预设阈值的情况下，确定所述图像块序列的第三运动参数和第四运动参数是否均小于预设阈值，其中，所述第三运动参数为所述第t-2个图像帧的图像块与所述第t-1个图像帧的图像块之间的运动参数，所述第四运动参数为所述第t+1个图像帧的图像块与所述第t+2个图像帧的图像块之间的运动参数；

在所述第三运动参数和所述第四运动参数均小于所述预设阈值的情况下，确定所述图像块序列对应的超分网络模型为第二超分网络模型；

在所述第三运动参数和/或所述第四运动参数大于或等于所述预设阈值的情况下，确定所述图像块序列对应的超分网络模型为第三超分网络模型。
根据权利要求4所述的视频的超分辨率方法，其中，所述第一超分网络模型为单帧超分网络模型；

所述第二超分网络模型用于基于所述第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块，对所述第t个图像帧的图像块进行超分；

所述第三超分网络模型用于基于图像块序列中的所有图像块对所述第t个图像帧的图像块进行超分。
根据权利要求5所述的视频的超分辨率方法，其中，通过所述第一超分网络模型对所述第t个图像帧的图像块进行超分，包括：

通过级联可形变卷积PCD对齐模块对所述第t个图像帧的图像块进行处理获取第一特征；

通过特征融合模块对所述第一特征进行处理，获取第二特征，所述第二特征为将多个所述第一特征在通道维度上拼接得到的特征；

通过重建模块对所述第二特征进行重建，获取第一图像块；

通过上采样模块对所述第一图像块进行上采样，获取所述第t个图像帧的图像块对应的超分图像块。
根据权利要求6所述的视频的超分辨率方法，其中，所述第二特征为将五个所述第一特征在通道维度上拼接得到的特征。
根据权利要求5-7任一项所述的视频的超分辨率方法，其中，通过所述第二超分网络模型对所述第t个图像帧的图像块进行超分，包括：

通过PCD对齐模块对所述第t-1个图像帧的图像块、所述第t个图像帧的图像块以及所述第t+1个图像帧的图像块进行处理，获取第三特征，其中，所述第三特征为将第四特征、第五特征以及第六特征在通道维度上拼接得到的特征，所述第四特征为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第五特征为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第六特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征；

通过特征融合模块对所述第三特征进行处理，获取第七特征，其中，所述第七特征为所述第四特征、所述第三特征以及所述第五特征在通道维度上拼接得到的特征；

通过重建模块对所述第七特征进行重建，获取第二图像块；

通过上采样模块对所述第二图像块进行上采样，获取所述第t个图像帧的图像块对应的超分图像块。
根据权利要求5-8任一项所述的视频的超分辨率方法，其中，通过所述第三超分网络模型对图像块序列中的所述第t个图像帧的图像块进行超分，包括：

通过PCD对齐模块对图像块序列中的全部图像块进行处理，获取第八特征，其中，所述第八特征为将第九特征、第十特征、第十一特征、第十二特征以及第十三特征在通道维度上拼接得到的特征，所述第九特征为通过所述PCD对齐模块对所述第t-2个图像帧的图像块和所述第t-1个图像帧的图像块进行处理得到的特征，所述第十特征为通过所述PCD对齐模块对所述第t-1个图像帧的图像块和所述第t个图像帧的图像块进行处理得到的特征，所述第十一特征为通过所述PCD对齐模块对所述第t个图像帧的图像块进行处理得到的特征，所述第十二特征为通过所述PCD对齐模块对所述第t个图像帧的图像块和所述第t+1个图像帧的图像块进行处理得到的特征，所述第十三特征为通过所述PCD对齐模块对所述第t+1个图像帧的图像块和所述第t+2个图像帧的图像块进行处理得到的特征；

通过特征融合模块对所述第八特征进行处理，获取第十四特征；

通过重建模块对所述第十四特征进行重建，获取第三图像块；

通过上采样模块对所述第三图像块进行上采样，获取图像块序列中的所述第t个图像帧的图像块对应的超分图像块。
根据权利要求1-9任一项所述的视频的超分辨率方法，其中，分解所述第t个图像帧和所述邻域图像帧得到的图像块中相邻图像块具有重叠区域，所述根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧，包括：

拼接所述第t个图像帧的各个超分图像块，生成拼接图像；

将所述拼接图像中各个超分图像块的重叠区域的各个像素点的像素值设置为各个超分图像块中对应的像素点的像素值的平均值，生成所述第t个图像帧的超分图像帧。
根据权利要求1-10任一项所述的视频的超分辨率方法，所述将待超分视频的第t个图像帧分解为N个图像块，包括：

通过尺寸为一个图像块的尺寸的采样窗口，从所述第t个图像帧的第一个像素点开始，以预设步长滑动对所述第t个图像帧的各个位置采样，并将采样窗口的每个采样区域作为一个图像块，得到N个图像块。
一种视频的超分辨率装置，包括：

图像分解模块，用于分别将待超分视频的第t个图像帧和所述第t个图像帧的邻域图像帧分解为N个图像块，其中，t、N均为正整数；

序列生成模块，用于根据分解所述第t个图像帧和所述邻域图像帧得到的图像块，生成N个图像块序列，其中，所述图像块序列中的各个图像块分别位于不同图像帧的相同位置；

参数计算模块，用于计算各个图像块序列的运动参数，其中，任一图像块序列的运动参数用于表征该图像块序列中各个相邻图像帧的图像块之间的光流；

模型确定模块，用于根据各个图像块序列的运动参数确定各个图像块序列对应的超分网络模型；

图像超分模块，用于采用各个图像块序列对应的超分网络模型对各个图像块序列中的所述第t个图像帧的图像块进行超分，获取所述第t个图像帧的各个超分图像块；

图像生成模块，根据所述第t个图像帧的各个超分图像块生成所述第t个图像帧的超分图像帧。
一种电子设备，包括：

存储器和处理器；

所述存储器用于存储指令；

所述处理器用于在执行所述指令时，使得所述电子设备实现权利要求1-11任一项所述的视频的超分辨率方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令被处理器执行时，实现权利要求1-11任一项所述的视频的超分辨率方法。
一种计算机程序产品，其中，当所述计算机程序产品在计算机上运行时，使得所述计算机实现如权利要求1-11任一项所述的视频的超分辨率方法。
一种计算机程序，包括：

指令，所述指令当由处理器执行时使所述处理器执行如权利要求1-11任一项所述的视频的超分辨率方法。