WO2011110088A1

WO2011110088A1 - 一种视频预测编码方法和装置

Info

Publication number: WO2011110088A1
Application number: PCT/CN2011/071611
Authority: WO
Inventors: 陶品; 吴文婷; 肖谋; 温江涛; 谷沉沉; 吕静; 盛馥钟
Original assignee: 清华大学; 腾讯科技（深圳）有限公司
Priority date: 2010-03-12
Filing date: 2011-03-08
Publication date: 2011-09-15
Also published as: SG183888A1; BR112012022951B1; BR112012022951A2; MX2012010518A; CA2797569C; CN101783957A; CA2797569A1; RU2012142523A; US8654845B2; US20130051468A1; CN101783957B; RU2536366C2

Description

一种视频预测编码方法和装置

技术领域

本发明涉及视频处理技术领域，更具体地，本发明涉及一种视频预测编码方法和装置。发明背景

目前，网络应用逐渐向多媒体业务方向发展。视频作为多媒体业务的重要组成部分，已经成为信息传播的主要载体之一。视频的广泛应用对视频的质量提出了新的要求，现在各种视频的分辨率也越来越大。同时，视频数据量的增长速度也远远超过存储设备和网络带宽的发展速度，因此视频压缩编码技术受到了长期广泛的关注。

在现有的视频压缩编码技术中，一般将视频分为 I帧、 P帧和 B帧进行编码。 I 帧是帧内编码帧，在编码过程中只能利用帧内的信息进行预测，而解码时也只需要利用本帧的码流即可解码重构该帧图像。 I 帧的编解码过程均是独立的，与前后帧的信息无关。 P帧和 B帧在编码过程中，除了采用帧内预测技术，还可以进行帧间预测，帧间预测技术需要在参考帧中搜索出与当前宏块最相似的块作为预测，而在解码时，根据运动向量信息从已解码的参考帧中找到预测块实现解码。 P帧和 B帧的编解码过程均不独立，时间复杂度高，但利用了帧间的时间相关性和帧内的空间相关性，能实现高效压缩。与 P帧和 B帧的编码过程相比， I 帧只利用帧内的空间相关性进行预测，编码过程独立，复杂度较低，但是 I帧的压缩效率远远不如 P帧和 B帧。

帧内预测目前主要应用在 I帧的编码过程中。不过，在 P帧或 B帧中，当帧间运动搜索技术难以搜索出准确的预测块时，也会有少量的宏块采用帧内预测。

目前，在 MPEG-2标准中，帧内预测采用筒单的空域预测算法。编码块的每个像素都采用像素值 128进行预测，而不是利用编码帧本身的信息进行预测。对大多数序列而言，这种方法预测残差较大，因此采用这种帧内预测方法的 I帧压缩效率^ ^氐。在 MPEG-4标准中，帧内编码块采用了频域的 DC/AC预测算法，编码块首先进行 DCT变换到频域，利用相邻块的 DC/AC系数对当前块的系数进行预测，利用 MPEG-4方法， I帧的压缩有所提高。在 H.264/AVC中，采用了方向预测的帧内预测算法。该算法对于每个 16x16、 8x8或者 4x4的像素块，利用其上边、左边、左上和右上的已编码块从一定的方向进行预测。方向预测技术较大幅度的提高了 I帧的压缩效率，但是在这种以块为预测单元的预测过程中只利用了块间的像素的相关性，对于块内相邻像素之间的相关性，仍然没有加以充分利用。对于整个块而言，块内离预测像素较远的像素难以得到准确的预测，因此帧内预测残差较大，特别是对于具有复杂纹理信息的块难以达到良好的预测效果，从而直接导致了帧内编码的压缩效率较低，进而影响整个视频序列的压缩效率。

然而，内容相同的视频图像，分辨率越高，像素之间的相关性也就越大，但现有的帧内编码技术并没有充分利用这种空间相关性。针对这个缺点，研究能充分利用像素间相关性的预测算法，提高视频编码的压缩效率，是具有重要意义的。发明内容

本发明实施方式提供了一种视频预测编码方法，以提高视频编码的压缩效率。

本发明实施方式还提供一种视频预测编码装置，以提高视频编码的压缩效率。

本发明实施方式的技术方案如下：

一种视频预测编码方法，该方法包括：

从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素；对所述主集像素进行编码，输出主集像素码流，并得到主集像素重构值；

对包括所述主集像素重构值在内的已重构像素值进行插值以作为余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值；

对所述主集像素重构值和余集像素重构值进行组合，得到所述像素块的重构值。

一种视频预测编码装置，该装置包括像素划分单元、主集像素编码单元、余集像素编码单元和像素块重构值组合单元，其中：

像素划分单元，用于从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素；

主集像素编码单元，用于对所述主集像素进行编码，输出主集像素码流，并得到主集像素重构值；

余集像素编码单元，用于对包括所述主集像素重构值在内的已重构像素值进行插值作为余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值；

像素块重构值组合单元，用于对所述主集像素重构值和余集像素重构值按照与像素划分相对应的方式进行组合，得到所述像素块的重构值。

从上述技术方案可以看出，在本发明实施方式中，首先从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素，然后对主集像素进行编码，输出主集像素码流，并得到主集像素重构值，并对至少包括主集像素重构值在内的已重构像素值进行插值，对余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值，最后对主集像素重构值和余集像素重构值进行组合，得到像素块的重构值。由此可见，本发明实施方式充分利用了帧内像素间的相关性，提高了预测准确度，减小了预测残差，因而能够直接降低残差的码流开销，提高了压缩效率。

而且，将本发明实施方式用于 H.264/AVC的 I帧编码，采用水平隔列抽样分解为偶宏块和奇宏块，可以降低编码帧内预测模式标志信息的码流开销，从而能够进一步提高压缩效率。对于奇宏块，固定的预测模式节约了预测模式标志信息的码流开销；而对于偶宏块，改进的帧内预测模式预测编码方法使帧内预测模式标志信息的码流开销能得到较大限度的节约。

不仅与此，本发明实施方式具有较低的实现复杂度。利用已编码偶宏块的重构像素块对奇宏块进行预测编码时， 6抽头插值滤波器的计算只利用了 19x16个像素点，其中有 16x16个像素来自于当前 32x16块中属于偶宏块的像素， 3x16个像素来自于左边的已重构邻居宏块，编码过程中不需要緩存其他行的宏块，因而极大地节省了内存占用，提高了高速緩存的命中率。尤其是对于数据量很大的高清视频源，这种低内存占用的方案易于芯片实现。还有，本发明实施方式非常适合高度并行计算的实现，从而能对高清视频源进行快速的编码压缩。附图简要说明

图 1为根据本发明实施方式的视频预测编码方法流程图；

图 2为根据本发明实施方式的隔行隔列抽样示意图；

图 3为根据本发明实施方式的棋盘抽样示意图；图 4为根据本发明实施方式的抽样单元为 2x1像素块的类棋盘抽样示意图；

图 5为根据本发明实施方式的 I帧亮度分量编码流程图；

图 6为根据本发明实施方式的宏块分解示意图；

图 7为根据本发明实施方式的 4x4亮度块预测像素的选择示意图；图 8为根据本发明实施方式的偶宏块插值作为奇宏块预测值的示意图；

图 9为根据本发明实施方式的偶宏块帧内预测模式的预测示意图；图 10 为根据本发明实施方式的视频预测编码装置总体框架结构示意图；

图 11为根据本发明实施方式的视频预测编码装置结构示意图；图 12为根据本发明实施方式的 BigShips序列的率失真曲线对比图。实施本发明的方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。的缺陷，本发明实施方式提出一种基于相邻像素相关性的视频预测编码方法，以实现克服上述缺陷和提高编码效率的目的。

图 1为根据本发明实施方式的视频预测编码方法流程图。

如图 1所示，该方法包括：

步骤 101 : 从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素。

比如，可以从当前编码帧中取出 M*N大小的像素块，将这 M*N大小的像素称为原块，其中 M为像素块的宽， N为像素块的高。这 M*N 大小的像素块既可以是亮度块，还可以是色度块，本发明实施方式对此并无限定。然后，按某种取样规则抽取该 M*N大小的像素块内的部分像素（设定这部分像素点的个数为这部分像素称为主集像素；余下的像素记为余集像素。也就是，从 M*N大小的原块中抽样出个像素点组成主集像素，并将其余像素组成余集像素。在这里， M应该小于或者等于当前帧的帧宽， N小于或等于当前帧的帧高，而且 P<M*N (即要求主集像素大小必须小于原块大小；)。

更具体地，可以根据隔行隔列抽样方式或根据棋盘抽样方式（或者类棋盘抽样方式）将该像素块划分为主集像素和余集像素。

下面对抽样方式进行详细说明。

隔行隔列抽样根据行抽样周期（记为 7>, 7>为非 0整数， Tr<N), 列抽样周期（记为；, 7；为非 0整数， T_C<M, T_r - T_c≠1 ), 首行主集像素在像素块中的行号（记为 r, r= l,..., T_r)和首列主集像素在像素块中的列号（记为 c, c= l,..., T_c) 的不同表现为不同的抽样方式。

图 2为根据本发明实施方式的隔行隔列抽样示意图，其中参数 c = 3, r = 4, T_c = 4, T_r=5。灰色方块代表的像素组成主集像素，若将主集像素按初始位置顺序排列成 *«大小的块，即主集像素的宽为 , 主集像素的高为《, 则、 n ) M、 N之间的关系如式（1)。

(类）棋盘抽样包括棋盘抽样和由棋盘抽样转化出的各种抽样方法。棋盘抽样时，每个被抽样出像素的上、下、左、右相邻像素均未被抽样。若被抽样出单元不再是一个像素点，而是固定大小的像素块，但仍然采用棋盘抽样的规则，称这类抽样为类棋盘抽样。图 3为根据本发明实施方式的棋盘抽样示意图；图 4为根据本发明实施方式的抽样单元为 2x1 像素块的类棋盘抽样示意图。如图 3所示，灰色方块（或白色方块）代表的像素被抽样出组成主集像素。

注意到，主集像素的大小根据抽样方式的不同而不同，主集像素根据编码需要可以构成编码块，余集像素由原块中除去主集像素后余下的像素组成，因此，余集像素大小可以与主集像素相同或者不同，余集像素组成的编码块在形状、数量上并非一定与主集像素一致。

步骤 102: 对主集像素进行编码，输出主集像素码流，并得到主集像素重构值。

在这里，主集像素的预测方法根据当前编码帧类型的不同而不同。若当前帧为 I帧，主集像素可以采用类似 H.264/AVC方向预测算法进行预测；若当前帧为 P帧或 B帧，主集像素可以采用类似 H.264/AVC方向预测算法或者帧间运动搜索技术进行预测。

具体包括，首先判断当前帧的类型，并当当前帧的类型为 I帧时，采用类似 H.264/AVC方向预测算法对主集像素进行编码，如果当前帧的类型为 P帧或 B帧时，可以采用类似 H.264/AVC方向预测算法或者帧间运动搜索算法对所述主集像素进行编码。

更具体地， H.264/AVC 是目前压缩效率最高的视频编码标准，在 H.264/AVC中，帧内编码的块采用方向预测技术进行帧内预测。方向预测对不同尺寸的块采用不同的预测模式。对于亮度分量，块尺寸有 16x16 和 4x4两种，其中 16x16亮度块（对应的宏块类型为 I16MB )有 4种预测模式， 4x4亮度块（对应的宏块类型为 I4MB ), 有 9种预测模式；对于色度分量，块尺寸为 8x8, 有 4种预测模式。 16x16亮度块（或 8x8 色度块）有 4种预测模式，分别为水平预测、竖直预测、 DC预测和平面预测。水平预测时，每行像素的预测值相等，预测值即为左边相邻已重构块在该行的边界像素值；竖直预测时，每列像素的预测值相等，预测值即为上边相邻已重构块在该列的边界像素值； DC预测时，整个块采用相同的预测值，预测值由该块上边相邻已重构块的 16个（或 8个）边界像素、左边相邻已重构块的 16个（或 8个）边界像素和左上角的相邻像素取平均得到，如果这些像素中有部分像素不存在（当前宏块位于图像上边界或者左边界时），则由存在的像素取平均得出预测值；平面预测时，用当前块左边和上边相邻已重构块的边界像素通过一个线性函数实现对当前块中每个像素的预测。对于 4x4亮度块进行方向预测时，对应的预测模式分别为竖直预测（模式编号 0 )、水平预测（模式编号 1 )、对角线左下预测（模式编号 3 )、对角线右下预测（模式编号 4 )、竖直向右预测（模式编号 5 )、水平向下预测（模式编号 6 )、竖直向左预测 (模式编号 7 )、和水平向左预测（模式编号 8 ), 连同 DC预测（模式编号 2 )—共 9中预测模式，每种预测模式利用该模式对应方向上的已重构像素对当前块的像素进行预测。

步骤 103: 对包括所述主集像素重构值在内的已重构像素值进行插值得到余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值。

在这里，已重构像素值既可以就是主集像素重构值自身，也可以包括主集像素重构值以及除了该像素块之外的其它像素块的重构值。比如，当前编码的像素块为第一个执行编码的像素块时，则没有除了该像素块之外的其它像素块的重构值，此时已重构像素值就只包括主集像素重构值，则只对主集像素重构值进行插值得到余集像素的预测值，再对余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值。当存在其它像素块的已重构像素值时，则共同利用包括主集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到余集像素的预测值，再进行帧内预测编码，输出余集像素码流，并得到余集像素重构值。

优选的，根据余集像素中各像素所在的位置对所述余集像素中各像素进行分类，其中将相邻信息已知程度相同的像素放在同一类别；然后，对于各个分类的余集像素，分别对包括主集像素重构值、已重构的余集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到预测值，再进行分层结构的帧内预测编码。

具体地，余集像素利用所有已重构像素值特别是主集像素的重构值进行预测。根据余集像素的大小，特别是当余集像素大小远大于主集像素时（比如，余集像素大小是主集像素的 10倍时），可以对余集像素再分类，并采用分层结构进行预测。余集像素主要根据余集像素所在的位置进行分类，像素位置决定像素的相邻信息已知的程度，将相邻信息已知程度相同的余集像素放在同一类别。同类别的像素采用统一的预测方式，不同类别的余集像素采用不同预测方式。余集像素在采用分层结构预测编码时，底层预测（即后编码像素的预测）可以利用高层预测（即先编码像素的预测）编码后的结果，较底层的预测具有较高的准确性。因此不同类别的像素在后续的量化过程中，可以根据预测的准确程度选择不同的量化精度，对较高层的预测残差数据采用较高的量化精度。

在具体实施中，余集像素的预测值主要采用插值滤波器对已重构像素值进行插值得到。对于分层结构预测，可以根据每层余集像素的情况设计多种滤波器。滤波器设计可以有多种。既可以直接复制已重构的相邻像素值，也可以利用 H.264/AVC的 6抽头滤波器，还可以设计其他类型的滤波器，也可以用多种滤波器分别插值并从中并选择最佳的预测结果。

步骤 104: 对主集像素重构值和余集像素重构值进行组合，得到像素块的重构值。

在这里，将步骤 102得到的主集像素的重构值和步骤 103中得到的余集像素的重构值重新组合得到原块的重构值，组合方式为步骤 101中取样方式的逆过程。

以上详细描述了本发明实施方式的编码实现流程。

下面以视频图像的 I帧亮度分量编码为实例说明本发明实施方式的编码过程。

图 5为根据本发明实施方式的 I帧亮度分量编码流程图。在这个实例中，以宽为 32, 高为 16的 32x16亮度块（此处的 32即对应于前述的 M, 16对应于前述的 N )为实例对本发明实现流程进行说明。本领域技术人员可以意识到，以 32x16亮度块为实例进行说明仅是阐述性目的，并不用于限定本发明的实施范围。

如图 5所示，该方法包括：

步骤 501 : 在当前编码帧的位置取出 32x16亮度块（相当于水平方向上连续的两个自然宏块），并对该 32x16 亮度块进行水平分解，其中由偶数列构成偶宏块，奇数列构成与偶宏块对应的奇宏块。

更具体地，将 32x16亮度块的偶数列（编号为 2、 4、 6 16的列）抽取出构成偶宏块，将 32x16亮度块的奇数列（编号为 1、 3、 5

15的列）抽取出构成奇宏块，具体示意如图 6所示。

步骤 502: 判断当前编码位置是否到达该帧的右边界宏块，是否只剩一个单独的宏块而无法取出 _32χ16的亮度块，如果是则执行步骤 503 , 否则执行步骤 504。

步骤 503:对单独宏块采用方向预测算法进行编码，并执行步骤 507。具体地，对于右边界剩余的单独的一个宏块，采用方向预测算法进行预测，并对预测残差进行变换、量化和熵编码以输出该块码流，同时对量化系数进行反量化反变换得到该块的重构块。

步骤 504: 对偶宏块采用方向预测算法进行预测，并对预测残差进行变换、量化和熵编码以输出该块码流，同时对量化系数进行反量化反变换得到该块的重构块。

更具体地，该偶宏块仍然要对 I16MB (对 16x16宏块整体做帧内预测编码的宏块类型 ) 的 4种预测模式（即水平预测、竖直预测、 DC预测和平面预测）和 I4MB (将 16x16宏块分为 16个 4x4的块，对每个块分别做帧内预测的宏块类型）的 9种预测模式（即竖直预测（模式编号 0 )、水平预测（模式编号 1 )、对角线左下预测（模式编号 3 )、对角线右下预测（模式编号 4 )、竖直向右预测（模式编号 5 )、水平向下预测 (模式编号 6 )、竖直向左预测（模式编号 7 )、水平向左预测（模式编号 8 )和 DC预测（模式编号 2 ) )进行模式判决，以编码计算选择最优的预测模式。当前偶宏块作为 16x16的块进行预测时，预测方法和输入像素的位置，与现有技术中方向预测算法对 16x16亮度块进行预测的方法是一致的。若当前宏块分解为 16个 4x4块进行预测，虽然预测模式保持为 9种，但用来预测的像素的位置有所改变。如图 6所示，灰色的圓点表示组成偶宏块的像素点，白色的圓点表示组成奇宏块的像素点，长方形框中的灰色圓点组成当前编码的 4x4 块，用来预测的像素点为 A-M, 其中像素 A-D来自于当前宏块上方的相邻偶宏块，像素 I-M来自于当前宏块左边的相邻偶宏块，这与现有技术中方向预测算法对 4x4亮度块进行预测时预测像素点的选择是一致的，但是像素 E-H位置有所改变，像素 E-H来自于当前宏块右上方最近的自然相邻块。

步骤 505: 利用偶宏块的重构像素对奇宏块进行预测，这里利用 H.264/AVC的 6抽头滤波器对重构出的偶宏块进行插值，得到奇宏块的预测值。对奇宏块的预测残差进行变换、量化和熵编码以输出码流，同时对量化系数进行反量化反变换得到该块的重构块。

更具体地，利用偶宏块的重构像素块对奇宏块进行预测。当偶宏块重构后，即奇宏块左右的相邻像素已被重构，在这里，可以应用 6抽头插值滤波器对偶宏块的重构像素值进行插值，得到当前奇宏块的预测值。如图 7所示，灰色的原点表示偶宏块中已经被重构出的像素，白色的原点表示当前奇宏块的待编码像素。

对于当前奇宏块待编码像素 X, 其预测值可以 X预表示。可以用位于像素 X左右的已重构像素 A、 B、 C、 D、 E和 F的重构值，应用下式 ( 2 )进行插值作为当前奇宏块待编码像素 X的预测值 X _¾。

X 领 = ound( (A 重构一 5B 重构 +20G 重构 + 20D 重构一 5E 重构 + F 重构) 1 32 ) ( 2 );

其中 round为四舍五入取整函数；

C 重构为像素 X左边最接近的已重构像素 C的重构值；

B 重构为像素 X左边第二接近的已重构像素 B的重构值；

A 重构为像素 X左边第三接近的已重构像素 A的重构值；

D 重《为像素 X右边最接近的已重构像素 D的重构值；

E 重构为像素 X右边第二接近的已重构像素 E的重构值；

F 重构为像素 X右边第三接近的已重构像素 F的重构值。

在步骤 505中，奇宏块的每个像素均由其相邻像素单独预测，充分利用了像素间的水平相关性，预测结果较方向预测更加准确。尤其是对于具有复杂纹理的块，这种预测方式的预测效果显著提高，这也直接带来编码性能的提高。步骤 505的应用还会带来另一个优势，即本发明实施方式的帧内编码方法较 H.264/AVC 时间复杂度显著降低。由于步骤 505的应用，当前编码的 I帧中，有接近一半或者一半的像素是用筒单统一的 6抽头插值滤波器进行预测的，不需要进行高复杂度的模式判决，这极大地降低了计算复杂度。

在现有技术中，在 H.264/AVC视频编码标准中，对于采用 I4MB类型的编码的宏块，需要在码流中记录每个 4x4块的预测模式。为了节约这部分码流开销，需要对这些预测模式进行预测。由于步骤 505的采用，奇宏块无论采用哪种宏块类型（ I4MB或 I16MB ), 只有固定的一种预测模式，因此不需要在码流中记录。而对于偶宏块，当采用 I4MB宏块类型时，仍然需要记录每个 4x4块的预测模式。为了更准确对 I4MB类型的偶宏块的预测模式进行预测，用来预测的块的位置有所改变。如图 9 所示，传统的帧内编码利用块 U和块 Lo的预测模式对当前块 (编号 1) 的预测模式进行预测，而步骤 505的使用使当前偶宏块的左边相邻宏块变为采用固定预测模式的奇宏块，因此这里采用位于当前偶宏块左边最近的偶宏块中的块 Le和块 U的预测模式对当前块（编号 1 ) 的预测模式进行预测，同样属于这种情况的还有当前偶宏块中编号为 5、 9、 13 的块和其他偶宏块中处于左边界位置的块。

步骤 506: 将步骤 504得到的偶宏块的重构块和步骤 505中得到的奇宏块的重构块进行组合得到原 32x16亮度块的重构块，其中偶宏块的每一列对应为 32x16块中的偶数列，奇宏块的每一列对应为 32x16块中的奇数列。

步骤 507: 判断当前帧是否编码完成，若编码完成，流程结束，否则跳转至步骤 501继续编码下一个亮度块。

基于上述详细描述，本发明实施方式还提出了一种视频预测编码装置。

图 10 为根据本发明实施方式的视频预测编码装置总体框架结构示意图。

如图 10所示，该装置包括像素划分单元 1001、主集像素编码单元 1002、余集像素编码单元 1003和像素块重构值组合单元 1004, 其中：像素划分单元 1001 , 用于从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素；

主集像素编码单元 1002, 用于对所述主集像素进行编码，输出主集像素码流，并得到主集像素重构值；

余集像素编码单元 1003 ,用于对包括所述主集像素重构值在内的已重构像素值进行插值作为余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值；

像素块重构值组合单元 1004,用于对所述主集像素重构值和余集像素重构值按照与像素划分相对应的方式进行组合 , 得到所述像素块的重构值。

在一个实施方式中，主集像素重构值获取单元 1002, 用于判断当前帧的类型，并当当前帧的类型为 I帧时，采用 H.264/AVC方向预测算法进行编码，当当前帧的类型为 P帧或 B帧时，采用类似 H.264/AVC方向预测算法或者帧间运动搜索算法进行编码。

在一个实施方式中，余集像素重构值获取单元 1003 , 用于根据余集像素中各像素所在的位置对余集像素中各像素进行分类，其中将相邻信息已知程度相同的像素放在同一类别，并且对于各个分类的余集像素，利用插值滤波器分别对包括主集像素重构值、已重构的余集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到预测值，再进行分层结构的帧内预测编码。

其中，余集像素重构值获取单元 1003 包括的插值滤波器可以是 H.264/AVC的 6抽头滤波器，也可以是其他滤波器。当采用 6抽头滤波器时， 6抽头插值滤波器，可以用于对已重构像素进行插值作为各个分类的余集像素预测值。图 11为根据本发明实施方式的视频预测编码装置结构示意图。在图 11中，该装置用于对一个 M*N像素块进行预测编码。

如图 11所示，该装置包括抽样单元，用于从当前编码帧中取出 M*N 大小的块，并按照某种取样规则抽取该块内的部分像素组为主集；余下的像素记为余集。

根据当前帧的类型的不同，主集像素可以采用适合帧类型的预测方式进行预测，并对预测残差进行变换、量化和熵编码以输出主集像素码流，同时对量化系数进行反量化、反变换，再加上主集像素的预测值得到主集像素的重构值。

对于余集像素，先对包括主集像素重构值在内的已重构像素值进行插值作为余集像素的预测值，再对预测残差进行变换、量化和熵编码以输出余集像素码流，同时对量化系数进行反量化、反变换，再加上余集像素的预测值得到余集像素的重构值。

最后对所述主集像素重构值和余集像素重构值按照与像素划分相对应的方式进行组合，得到所述像素块的重构值。如图 11 所示，圓圏表示对两个数据流相加，加号是指这个数据流取正，减号是指这个数据流取负。

下面对图 11进行更加详细的说明。首先，抽样单元从当前编码帧中取出 M*N大小的块，并按照某种取样规则抽取该块内的部分像素组为主集像素；余下的像素记为余集像素。

针对主集像素，根据当前帧的类型的不同，采用适合帧类型的预测方式进行预测。在节点 A处，从主集像素原始值中减去主集像素预测值得到主集像素预测残差，然后从节点 A向下依次运算，对主集像素预测残差进行变换、量化和熵编码以输出主集像素码流。其中，节点 A向下运算经过变换量化后的预测残差系数，还需要依次经历反量化和反变化，得到一个差分值。再在节点 B将这个差分值与主集像素的预测值相加，得到主集像素的重构值。

类似地，针对余集像素，首先对包括主集像素重构值在内的已重构像素值进行插值作为余集像素的预测值，再在节点 D处从余集像素原始值中减去余集像素预测值，得到余集像素预测残差，然后余集像素预测残差再依次经过变换、量化和熵编码后，输出余集像素码流。其中，节点 D向下运算经过变换量化后的预测残差系数，还需要依次经历反量化和反变化，得到一个差分值，再在节点 C将差分值与余集像素的预测值运算，得到余集像素的重构值。

如图 5实例说明，对于每一个 I帧应用本发明实施方式以后，由于有一半（或接近一半）的像素采用了一种筒单的、固定的、有效的插值滤波算法进行预测，充分利用了帧内像素间的水平相关性，提高预测准确度，减小预测残差，因而直接降低了残差的码流开销，提高了压缩效率。

同时，本发明实施方式降低了帧内预测模式标志信息的码流开销，这也是压缩效率提高的另一个原因。对于奇宏块，固定的预测模式节约了预测模式标志信息的码流开销；而对于偶宏块，改进的帧内预测模式预测编码方法使帧内预测模式标志信息的码流开销能得到较大限度的节约。

而且，本发明实施方式实例中的帧内编码方案对奇宏块利用已编码偶宏块的重构像素块，采用筒单统一的 6抽头插值滤波器进行预测编码，这样，在当前编码的 I帧中，有接近一半或者一半的像素不需要进行高复杂度的模式判决计算，因此相对于 H.264/AVC的帧内预测算法，计算复杂度得到极大的降低。

另外，本发明技术方案具有较低的实现复杂度。利用已编码偶宏块的重构像素块对奇宏块进行预测编码时， 6抽头插值滤波器的计算只利用了 19x16个像素点，其中有 16x16个像素来自于当前 32x16块中属于偶宏块的像素， 3x16个像素来自于左边的已重构邻居宏块，编码过程中不需要緩存其他行的宏块，因而极大地节省了内存占用，提高高速緩存的命中率。尤其是对于数据量很大的高清视频源，这种低内存占用的方案易于芯片实现。

不仅与此，本发明技术方案适合高度并行计算的实现，从而能对高清视频源进行快速的编码压缩。

将本发明实施方式的方法应用到 H.264/AVC标准的基本档次，参考软件采用 H.264/AVC标准的参考软件 JM15.0, 在分辨率为 720p的序列上能获得平均为 0.39dB的 PSNR增益或 7.31%的码率节省。

图 12为根据本发明实施方式的 BigShips序列的率失真曲线对比图。图 12给出了在分辨率为 720p帧率为 30fps的 BigShips序列上率失真曲线对比。其中：图形上方的曲线为应用本发明实施方式在分辨率为 720p 帧率为 30fps 的 BigShips序列上率失真曲线；图像下方的曲线为应用 H.264在分辨率为 720p帧率为 30fps的 BigShips序列上率失真曲线。在这个序列上，本发明实施方式能获得 0.79dB的峰值信噪比（PSNR )增益或 15%的码率节省。

以上所述仅为本发明的较佳实施方式而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明方式保护的范围之内。

Claims

权利要求书

1、一种视频预测编码方法，其特征在于，该方法包括：

对包括所述主集像素重构值在内的已重构像素值进行插值以作为所述余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值；

2、根据权利要求 1所述的方法，其特征在于，所述将该像素块划分为主集像素和余集像素包括：根据隔行隔列抽样方式、棋盘抽样方式或类棋盘抽样方式将该像素块划分为主集像素和余集像素。

3、根据权利要求 1所述的方法，其特征在于，所述对主集像素进行编码包括：

判断所述当前帧的类型，并当所述当前帧的类型为 I 帧时，采用 H.264/AVC方向预测算法对所述主集像素进行编码，当所述当前帧的类型为 P帧或 B帧时，采用类似 H.264/AVC方向预测算法或者帧间运动搜索算法对所述主集像素进行编码。

4、根据权利要求 1所述的方法，其特征在于，所述已重构像素值为所述主集像素重构值。

5、根据权利要求 1所述的方法，其特征在于，所述主集像素重构值包括所述主集像素重构值以及除了该像素块之外的其它像素块的重构值。

6、根据权利要求 1-5中任一项所述的方法，其特征在于，所述对包括主集像素重构值在内的已重构像素值进行插值作为所述余集像素的预测值，再对余集像素进行帧内预测编码包括：

根据所述余集像素中各像素所在的位置对所述余集像素中各像素进行分类，其中将相邻信息已知程度相同的像素放在同一类别；

对于各个分类的余集像素，分别对包括主集像素重构值、已重构的余集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到预测值，再进行分层结构的帧内预测编码。

7、根据权利要求 6所述的方法，其特征在于，对包括主集像素重构值、已重构的余集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到预测值，再进行分层结构的帧内预测编码包括：

利用 H.264/AVC的 6抽头滤波器，对所有已重构像素进行插值作为各个分类的余集像素预测值。

8、根据权利要求 7所述的方法，其特征在于，所述主集像素为偶宏块，余集像素为奇宏块；对于奇宏块的任意像素 X, 其预测值 Χ _¾为：

X 领 = ound( (A 重构一 5B 重构 +20G 重构 + 20D 重构一 5E 重构 + F 重构) I 32 ); 其中 round为四舍五入取整函数；

C 重《为像素 X左边最接近的已重构像素 C的重构值；

B 重构为像素 X左边第二接近的已重构像素 B的重构值；

A 重构为像素 X左边第三接近的已重构像素 A的重构值；

D 重《为像素 X右边最接近的已重构像素 D的重构值；

E 重构为像素 X右边第二接近的已重构像素 E的重构值；

F 重构为像素 X右边第三接近的已重构像素 F的重构值。

9、根据权利要求 1所述的方法，其特征在于，所述从当前帧中取出像素块，并将该像素块划分为主集像素和余集像素为：根据隔行隔列抽样方式将该像素块划分为主集像素和余集像素，其中：

主集像素的宽为 , 主集像素的高为《, 且、《具有：

M-c N-r

m + l,n + 1

T T

Μ为该像素块的宽； N为该像素块的高；

7；为列抽样周期；；为行抽样周期；7；为非 0整数， T_r N 7；为非

0 数， T_C<M, T_r · T_c≠l;

r为首行主集像素在像素块中的行号， r= l,— , T_r; c为首列主集像素在像素块中的列号， c= l,..., r_c。

10、根据权利要求 1-9中任一项所述的方法，其特征在于，所述像素块为亮度块或色度块。

11、一种视频预测编码装置，其特征在于，该装置包括像素划分单元、主集像素编码单元、余集像素编码单元和像素块重构值组合单元，其中：

余集像素编码单元，用于对包括所述主集像素重构值在内的已重构像素值进行插值作为所述余集像素的预测值，再对所述余集像素进行帧内预测编码，输出余集像素码流，并得到余集像素重构值；

像素块重构值组合单元，用于对所述主集像素重构值和余集像素重构值进行组合，得到所述像素块的重构值。

12、根据权利要求 11所述的视频预测编码装置，其特征在于，所述像素划分单元，用于根据隔行隔列抽样方式或根据棋盘抽样方式将该像素块划分为主集像素和余集像素。

13、根据权利要求 11所述的视频预测编码装置，其特征在于，所述主集像素编码单元，用于判断所述当前帧的类型，并当所述当前帧的类型为 I帧时，采用 H.264/AVC方向预测算法进行编码，当所述当前帧的类型为 P帧或 B帧时，采用类似 H.264/AVC方向预测算法或者帧间运动搜索算法进行编码。

14、根据权利要求 11所述的视频预测编码装置，其特征在于，所述余集像素编码单元，用于根据所述余集像素中各像素所在的位置对所述余集像素中各像素进行分类，其中将相邻信息已知程度相同的像素放在同一类别，并且对于各个分类的余集像素，对包括主集像素重构值、已重构的余集像素重构值以及其它像素块的已重构像素值在内的所有已重构像素值进行插值得到预测值，再进行分层结构的帧内预测编码。

15、根据权利要求 11-14 中任一项所述的视频预测编码装置，其特征在于，所述余集像素重构值获取单元包括 H.264/AVC的 6抽头滤波器；所述 H.264/AVC的 6抽头滤波器，对所有已重构像素进行插值作为各个分类的余集像素预测值。

16、根据权利要求 15所述的视频预测编码装置，其特征在于，所述主集像素为偶宏块，余集像素为奇宏块； \

对于奇宏块的任意像素 X, 其预测值 Χ _¾为：

X ¾ — ound( (A 重构一 5B 重构 +20G 重构 + 20D 重构一 5E 重构 + F 重构) I 32 ); 其中 round为四舍五入取整函数；

C 重构为像素 X左边最接近的已重构像素 C的重构值； B重构为像素 X左边第二接近的已重构像素 B的重构值；

A重构为像素 X左边第三接近的已重构像素 A的重构值；

D重《为像素 X右边最接近的已重构像素 D的重构值；

E重构为像素 X右边第二接近的已重构像素 E的重构值；

F重构为像素 X右边第三接近的已重构像素 F的重构值。

17、根据权利要求 11所述的视频预测编码装置，其特征在于，所述像素划分单元，用于根据隔行隔列抽样方式将该像素块划分为主集像素和余集像素，其中：

主集像素的宽为 , 主集像素的高为《, 且、《具有：

其中函数 L」为向下取整函数；

M为该像素块的宽； N为该像素块的高；

7；为列抽样周期；；为行抽样周期；7；为非 0整数， T_r<N; 7；为非

0整数， T_C<M, T_r · T_c≠l;

r为首行主集像素在像素块中的行号， r=l，. ··, T_r; c为首列主集像素在像素块中的列号， c=l,...,r_c。