CN107071496A

CN107071496A - 一种h.265/hevc帧间编码单元深度快速选择方法

Info

Publication number: CN107071496A
Application number: CN201710336856.XA
Authority: CN
Inventors: 刘鹏宇; 吴玥颖; 丰泽琪; 贾克斌
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2017-05-14
Filing date: 2017-05-14
Publication date: 2017-08-18
Anticipated expiration: 2037-05-14
Also published as: CN107071496B

Abstract

本发明公开一种H.265/HEVC帧间编码单元深度快速选择方法，首先，通过探究编码单元纹理复杂度、编码器量化参数与编码单元深度选择之间的关联关系，将顶端跳过思想应用于方法优化中，设计基于纹理复杂度和量化参数的编码单元初始划分深度预测策略，跳过非必要的大尺寸编码单元划分；其次，利用编码单元深度选择与编码码率、编码失真之间的关联性，将提前终止思想应用于方法优化中，设计基于码率和失真的编码单元终止划分深度选择策略，通过离线训练的分类器解决编码单元划分与不划分的决策问题。采用本发明的技术方案，在保证编码单元划分精度的同时，可平均节约34.56％的编码时间。

Description

一种H.265/HEVC帧间编码单元深度快速选择方法

技术领域

本发明属于视频压缩编码领域，涉及一种基于机器学习的H.265/HEVC帧间编码单元深度快速选择方法。

背景技术

在信息全球化日益深入的今天，视频因其能够携带丰富的视觉信息，而成为人类在信息时代中的主要资讯来源。由此，视频信息的普及引发了视频数据的爆炸式增长，同时也推动了以高效为标志的视频编码技术的长足进步。面对视频应用向着更高清晰度、更高帧率的发展趋势，专注于视频编码技术优化工作的研究者们并没有停止探寻的步伐，着眼于“更低码率”和“更高质量”的下一代视频编码标准——H.265/HEVC(High EfficiencyVideo Coding,H.265/HEVC)应运而生，为高清以及超高清视频的普及与高效编码提供了助力。作为H.264/AVC视频编码标准的继承与发展，H.265/HEVC可在编码质量相同的情况下节省近一半码率。众多先进编码工具的使用是使H.265/HEVC获得卓越编码性能提升的关键所在，其中，H.265/HEVC取代之前编码标准中16×16固定大小的“宏块”划分方式，采用“四叉树”式的编码单元(Coding Unit,CU)深度遍历方案，使编码单元深度(Depth)能够在0(64×64)到3(8×8)之间进行自适应选择，如图1所示，是H.265/HEVC区别于其他视频编码标准，而更加适用于高分辨率视频编码的基础所在。但上述优化方案在提升H.265/HEVC编码性能的同时，也极大地增加了编码器的复杂度，其复杂度可达H.264/AVC的2～10倍，而由灵活的编码单元深度选择所衍生出的帧间预测模式选择的复杂度更是占据了整个编码器复杂的90％，如图2所示，严重阻碍了H.265/HEVC在实际应用环境中的推广使用。因此，如何快速地进行编码单元深度选择对于降低H.265/HEVC编码器的复杂度至关重要。

目前，伴随H.265/HEVC视频编码标准的日益成熟与完善，以及提升其编码速度的迫切需求，研究者们设计了基于机器学习的帧间编码单元深度快速选择方案。机器学习是一门多领域的交叉学科，涉及概率论、统计学等多种专业理论，其目的在于使计算机能够模拟人脑的思考过程来帮助决策事件，以寻找问题的优化解决方案。在H.265/HEVC中，基于机器学习的帧间编码单元深度快速选择方案的核心思想是：将编码单元的划分问题建模为划分或不划分的二元决策问题后，应用K-近邻(K-Nearest Neighbor,KNN)策略、贝叶斯(Bayers)准则、支持向量机(Support Vector Machine,SVM)等机器学习领域的经典分类算法，帮助编码器在尽可能不进行率失真代价计算的前提下，实现准确地编码单元的深度决策，以获得编码时间的降低。

不可否认，基于机器学习思想的快速编码算法能够在保证视频重建质量的同时，较原始H.265/HEVC编码器比较，平均节省近25％的编码时间。但此类算法均是采用提前终止的设计思路，即从具有最大尺寸、最小深度的编码单元开始向下进行递归划分。然而，为了得到最优的编码结果，仍有50％以上的编码单元需要遍历所有深度。因此，如果能够将顶端跳过的思想同时引入到上述基于机器学习的编码单元深度快速决策算法中，即提前对当前编码单元的初始划分深度进行判别，是进一步加速编码过程的创新思路。

本发明基于H.265/HEVC编码标准，以机器学习为优化手段，提出一种融合顶端跳过与提前终止思想的帧间编码单元深度快速选择方法，在保证编码质量与深度选择准确性的前提下，通过避免非必要深度编码单元的率失真代价计算过程，有效地降低H.265/HEVC编码器复杂度。

发明内容

本发明所要解决的技术问题是，针对帧间编码单元深度遍历引起的高复杂度问题，提供一种融合顶端跳过与提前终止思想的帧间编码单元深度快速选择方法，在保证编码质量的同时，加速H.265/HEVC编码过程。

为实现上述目的，本发明采用如下的技术方案：

1、一种H.265/HEVC帧间编码单元深度快速选择方法，其特征在于，包括以下步骤：

第一步：利用典型序列BQTerrac、BasketballDrill、BQSquare、FourPeople在不同量化参数、不同纹理复杂度情况下经由HM-15.0编码后得到的编码单元所属类别分布情况，离线构建初始划分深度预测字典；

第二步，利用典型序列BQTerrac、BasketballDrill、BQSquare、FourPeople经由HM-15.0编码后不同深度编码单元的码率、失真以及划分结果，离线训练NN分类器；

第三步：根据编码器的配置文件读入视频序列，利用配置文件中的参数信息配置HM-15.0编码器；

第四步：从待编码视频中按顺序提取出需要编码的编码单元；

第五步，根据当前编码器的量化参数以及当前待编码单元的纹理复杂度，通过查找初始划分深度预测字典，判断当前待编码单元的所属类别；

第六步，若当前编码单元属于简单编码单元，则将初始划分深度设置为0；若当前编码单元属于复杂编码单元，则将初始划分深度设置为2；

第七步，计算当前待编码单元的码率与失真，得到分类特征F；

第八步，根据当前编码单元的深度，加载对应的NN分类器，并进行特征分类，输出当前编码单元的划分情况分类结果；

第九步，若输出结果为“SPLIT”，则当前编码单元需要继续划分，并将其划分为四个子编码单元，回到步骤七，重复执行上述过程，直至达到最大划分深度；若输出结果为“NON-SPLIT”，则当前编码单元不需要继续划分，将划分结果作为当前编码单元的最佳划分结果，结束当前编码单元的深度遍历过程。

作为优选，第一步和第二步中，编码单元初始划分深度预测字典的构建过程，以及NN分类器的训练过程，均是离线过程，不列入编码时间的计算范围内。

作为优选，第一步中，构建初始划分深度预测字典具体为：

1)定义编码单元类型

对于简单编码单元：初始划分深度为0，且编码单元中包含深度Depth＝0、Depth＝0,1、Depth＝1,2、Depth＝1,2,3或Depth＝1,3的编码结构；对于复杂编码单元：初始划分深度为2，且编码单元中只包含深度Depth＝2、Depth＝2,3或Depth＝3的编码结构；

2)构建编码单元初始划分深度预测字典

利用当前编码单元四个子编码单元熵值{H(1),H(2),H(3),H(4)}中的最小值表示当前编码单元的纹理复杂度，熵值的计算公式如下：

其中，p_i表示像素值i出现的概率。若当前区域中没有纹理，则熵值趋近于0；若区域中细纹理较多，则熵值较大；若区域中细纹理较少，则熵值较小；

统计不同量化参数QP与不同纹理复杂度情况下H.265/HEVC标准测试序列中所提供的四个具有不同时空特性和分辨率的典型序列，即BQTerrac、BasketballDrill、BQSquare、FourPeople，经由H.265/HEVC测试平台HM-15.0编码后，编码单元所属类别的分布情况，并以量化参数为X轴，熵值为Y轴，构建初始划分深度预测字典。

作为优选，第六步中具体为：查找编码单元初始划分深度字典后，若当前编码单元属于简单编码单元，则由初始划分深度0开始执行四叉树遍历过程；若当前编码单元属于复杂编码单元，则由初始划分深度2开始执行四叉树遍历过程。

作为优选，第八步中，依据当前编码器的量化参数QP及当前编码单元的深度，加载对应的NN分类器，并将特征值F作为NN分类器的输入特征，得到当前编码单元的划分情况分类结果。

与现有技术相比，本发明的优点在于：首先，本方法基于顶端跳过思想，通过利用编码单元深度选择情况与编码单元纹理复杂度、编码器量化参数之间的相关关系，设计了基于纹理复杂度与量化参数的编码单元初始划分深度联合预测方案。该方案能够帮助复杂编码单元跳过深度为0与深度为1的编码单元的率失真代价计算过程，从而节约编码时间。其次，本方法基于提前终止思想，通过利用编码单元深度选择情况与编码码率、编码失真之间的相关关系，以码率和失真为分类特征，将编码单元的划分问题建模为分与不分的二分类问题，设计了基于码率和失真的编码单元终止深度选择策略。该策略可以避免简单编码单元进行深度为2或3的编码单元的率失真代价计算过程，在保证视频重建质量的同时，实现编码器复杂度的降低。

附图说明

图1为H.265/HEVC的四叉树编码结构示意图；

图2为H.265/HEVC帧间编码单元四叉树遍历过程示意图；

图3为本发明方法的基本流程图；

图4为本发明中简单编码单元与复杂编码单元示意图；

图5为本发明构建得到的编码单元初始划分深度预测字典。

具体实施方式

以下结合附图和具体实施方式对本发明作进一步详细阐述。

如图3所示，本发明实施例提供一种H.265/HEVC帧间编码单元深度快速选择方法，分为以下两个方面：

第一、基于纹理复杂度和量化参数的编码单元初始划分深度预测

当前编码单元的初始划分深度与其纹理复杂度(Texture Complexity,TC)以及编码器的量化参数(Quantization Parameter,QP)密切相关。因此，为进一步提升H.265/HEVC的编码速度，本方法将“顶端跳过”思想引入基于机器学习的帧间编码单元深度快速选择算法中，通过构建基于纹理复杂度和量化参数的编码单元初始划分深度预测字典，在不进行率失真代价的情况下，实现编码单元初始划分深度的预先判别。

1)编码单元类型定义

由H.265/HEVC的编码结果可知，当前编码单元深度可选范围具有以下四种情况，分别为[0,1]，[1,2]，[1,3]和[2,3]，分别对应初始划分深度0，1，2和3。对于初始划分深度为2或3的编码单元，仍然需要经过深度为0和1的编码单元率失真代价计算过程。因此，编码单元深度遍历的高复杂度问题成为阻碍H.265/HEVC的编码时间降低、阻碍H.265/HEVC在实际环境中应用的主要瓶颈，如果能够提前判断当前编码单元的初始划分深度，可以进一步降低H.265/HEVC的编码复杂度。因此，本方法按照初始划分深度，将编码单元类型定义为简单编码单元与复杂编码单元，如图4所示。对于简单编码单元：初始划分深度为0，且编码单元中包含深度Depth＝0、Depth＝0,1、Depth＝1,2、Depth＝1,2,3或Depth＝1,3的编码结构；对于复杂编码单元：初始划分深度为2，且编码单元中只包含深度Depth＝2、Depth＝2,3或Depth＝3的编码结构。

2)编码单元初始划分深度预测字典构建

p_i表示像素值i出现的概率。若当前区域中没有纹理，则熵值趋近于0；若区域中细纹理较多，则熵值较大；若区域中细纹理较少，则熵值较小。

统计不同量化参数(QP＝0～51)与不同纹理复杂度情况下H.265/HEVC标准测试序列中所提供的四个具有不同时空特性和分辨率的典型序列(BQTerrac、BasketballDrill、BQSquare、FourPeople)经由H.265/HEVC测试平台HM-15.0编码后，编码单元所属类别的分布情况，并以量化参数为X轴(QP取值范围为0～51)，熵值为Y轴(测试序列中熵值最小值的取值范围为0.5～7.5，将其以0.1为单位进行量化)，构建初始划分深度预测字典，如图5所示。其中圆圈(○)表示当前量化参数与纹理复杂度条件下，测试结果中复杂编码单元数量多于简单编码单元，规定具有此类量化参数与纹理复杂度的编码单元为复杂编码单元；叉子(×)表示当前量化参数与熵值条件下，测试结果中简单编码单元数量多于复杂编码单元，规定具有此类量化参数与纹理复杂度的编码单元为复杂编码单元。

3)编码单元所属类别判断

计算当前待编码单元的四个子编码单元的熵值并保留最小值进行量化，依据量化后的熵值结果对当前编码单元的纹理复杂度TC进行表示，联合当前编码器的量化参数QP，通过查找字典的方式，判断当前编码单元的所属类别(简单/复杂)。

4)编码初始划分深度预测

查找编码单元初始划分深度字典后，若当前编码单元属于简单编码单元，则由初始划分深度0开始执行四叉树遍历过程；若当前编码单元属于复杂编码单元，则由初始划分深度2开始执行四叉树遍历过程。

第二、基于码率和失真的编码单元终止划分深度选择

选取合适的分类特征，并将其应用于基于机器学习的编码单元深度快速选择算法中，对于保证预测准确度，同时降低编码时间具有重要意义。因此，本方法通过挖掘编码码率(Rate)、失真(Distortion)与编码单元划分之间的关联关系后，将码率与失真作为分类器的分类特征，并利用离线训练的最近邻(Nearest Neighbor,NN)分类器，对当前编码单元是否继续划分进行提前预判，进而加速H.265/HEVC帧间编码过程。

1)NN分类器离线训练

最近邻算法是机器学习领域中最简单、最成熟且使用广泛的分类器之一，其核心思想是：“近者胜出”，即当前样本的分类结果取决于与它最邻近的样本的类别属性。如果当前样本在其特征空间中的最相邻样本属于某一个类别，则当前样本也属于这个类别，并具有这个类别中样本的基本特性。

统计H.265/HEVC标准测试序列中典型序列(BQTerrac、BasketballDrill、BQSquare、FourPeople)在QP＝0～51范围下，经由HM-15.0编码后不同深度(Depth＝0，1或2)编码单元的编码码率、编码失真以及划分情况，以码率、失真为分类特征，以划分情况(划分(SPLIT)或不划分(NON-SPLIT))为分类结果，离线训练NN分类器。

2)编码单元分类特征获取

利用HM-15.0编码当前编码单元，得到其码率Rate与失真Distortion，组成分类器的输入特征F＝[Rate,Distortion]。

3)编码单元划分情况分类

依据当前编码器的量化参数QP及当前编码单元的深度，加载对应的NN分类器，并将特征值F作为NN分类器的输入特征，得到当前编码单元的划分情况分类结果。

4)CU终止划分深度选择

根据NN分类器的输出结果“SPLIT”或“NON-SPLIT”判定当前编码单元是否继续划分。若输出结果为“SPLIT”，则当前编码单元需要继续划分，将其划分为四个子编码单元，并回到步骤2)编码单元分类特征获取，重复执行上述过程，直至达到最大深度(Depth＝3)；若输出结果为“NON-SPLIT”，则当前编码单元不需要继续划分，并将划分结果作为当前编码单元的最佳划分结果，结束当前CU的深度遍历过程。

本发明的针对H.265/HEVC的帧间编码过程，设计帧间编码单元深度快速选择方法。在实际的使用中，HM-15.0编码器将调用本发明中的方法来完成具体的编码工作。本发明方法的具体步骤如下：

第一步：利用典型序列BQTerrac、BasketballDrill、BQSquare、FourPeople在不同量化参数、不同纹理复杂度情况下经由HM-15.0编码后得到的编码单元所属类别分布情况，离线构建初始划分深度预测字典。

第二步，利用典型序列BQTerrac、BasketballDrill、BQSquare、FourPeople经由HM-15.0编码后不同深度编码单元的码率、失真以及划分结果，离线训练NN分类器。

第四步：从待编码视频中按顺序提取出需要编码的编码单元。

第五步，根据当前编码器的量化参数以及当前待编码单元的纹理复杂度，通过查找初始划分深度预测字典，判断当前待编码单元的所属类别(简单/复杂)。

第六步，若当前编码单元属于简单编码单元，则将初始划分深度设置为0；若当前编码单元属于复杂编码单元，则将初始划分深度设置为2。

第七步，计算当前待编码单元的码率与失真，得到分类特征F。

第八步，根据当前编码单元的深度，加载对应的NN分类器，并进行特征分类，输出当前编码单元的划分情况分类结果。

为了检验本发明所提出的方法的性能，将本发明的方法与H.265/HEVC原始编码器进行比较。测试序列为通用测试条件中的B、C、D、E类视频序列，如表1所示。同时，采用H.265/HEVC测试平台HM-15.0进行实验，编码器为低延时(LD)模式，具体配置信息如表2所示。

表1 H.265/HEVC测试序列

表2 H.265/HEVC编码器配置

采用BDBR(Delta Bit-rate)和BDPSNR(Delta Peak Signal-to-Noise Rate)评估本发明方法整体的编码性能增益；采用公式(2)对于本发明方法的时间复杂度进行度量。

其中，EncodingTime_HM15.0为原始编码器的编码时间，EncodingTime_Proposed为本发明方法的编码时间。正值BDBR或者负值BDPSNR表示编码码率上升或编码质量损失，负值ΔT表示编码时间减少。

表3为本发明方法与H.265/HEVC原始编码器的编码性能比较结果。从表3中可以看出，本发明方法与原始H.265/HEVC编码器相比，可平均降低34.56％的编码时间，而码率增加控制在1.21％～2.29％范围内，图像重建质量损失控制在0.08dB～0.26dB范围内，编码码率增加与编码质量损失可以忽略不计。

表3本发明算法与H.265/HEVC原始编码器的编码性能比较结果

实验结果表明，本发明的方法相比于H.265/HEVC原始编码器，能够在码流只有少许增加，编码质量基本不降低的情况下，平均节省34.56％的编码时间。此外，值得提出的是，编码单元初始划分深度预测字典的构建过程，以及NN分类器的训练过程，均是离线过程，不列入编码时间的计算范围内。

Claims

1.一种H.265/HEVC帧间编码单元深度快速选择方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种H.265/HEVC帧间编码单元深度快速选择方法，其特征在于，第一步中，构建初始划分深度预测字典具体为：

1)定义编码单元类型

2)构建编码单元初始划分深度预测字典

<mrow> <mi>H</mi> <mo>=</mo> <mo>-</mo> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>255</mn> </msubsup> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>&CenterDot;</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

3.如权利要求1所述的一种H.265/HEVC帧间编码单元深度快速选择方法，其特征在于，第六步中具体为：查找编码单元初始划分深度字典后，若当前编码单元属于简单编码单元，则由初始划分深度0开始执行四叉树遍历过程；若当前编码单元属于复杂编码单元，则由初始划分深度2开始执行四叉树遍历过程。

4.如权利要求1所述的一种H.265/HEVC帧间编码单元深度快速选择方法，其特征在于，第八步中，依据当前编码器的量化参数QP及当前编码单元的深度，加载对应的NN分类器，并将特征值F作为NN分类器的输入特征，得到当前编码单元的划分情况分类结果。