CN103974069A - 可重用的视频编码方法和编码器 - Google Patents
可重用的视频编码方法和编码器 Download PDFInfo
- Publication number
- CN103974069A CN103974069A CN201410219372.3A CN201410219372A CN103974069A CN 103974069 A CN103974069 A CN 103974069A CN 201410219372 A CN201410219372 A CN 201410219372A CN 103974069 A CN103974069 A CN 103974069A
- Authority
- CN
- China
- Prior art keywords
- inter prediction
- predicting unit
- image
- prediction parameter
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 82
- 230000000694 effects Effects 0.000 claims abstract description 30
- 230000000052 comparative effect Effects 0.000 claims description 13
- 238000002203 pretreatment Methods 0.000 claims description 13
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 230000006872 improvement Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 26
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005284 basis set Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明实施例提供一种可重用的视频编码方法和编码器。本发明可重用的视频编码方法,包括:获取一帧图像;根据预先设置的帧间预测参数获取对所述图像进行帧间预测的预测单元的处理顺序,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识;按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。本发明实施例解决PU选择算法固定且单一,当应用场景改变使得PU类型和处理顺序发生变化时,必须进行硬件改动才能适应新的场景,不利于编码系统性能改进和扩展的问题。
Description
技术领域
本发明实施例涉及视频压缩技术,尤其涉及一种可重用的视频编码方法和编码器。
背景技术
近年来,信息技术迅速发展,人们对视频的视觉质量要求不断提高,高清、超高清以及3D视频的出现受到大家的广泛青睐。但是,一个720P的高清图像未经压缩占用2.2兆字节(MByte,简称MB)的存储空间,如果一个视频的帧速率为30帧/秒,即使只有五分钟,数据量也将达到19千兆字节(GigaByte,简称GB),可见满足人们需求的高品质视频所占用的数据量是非常庞大的,未经压缩的原始的视频数据在现在甚至将来都是难以接受的,无论是存储还是传输都存在很大的问题。
视频数据中存在着大量的冗余,冗余主要包括以下几类,空间冗余,例如一幅图像中如果有较大的背景区域,那么这些区域的像素值是非常相似的;时间冗余,视频序列的连续帧中的前一帧与后一帧之间通常变换不大,具有很强的相似性,主要区别就在于仅仅在不同帧之间运动物体的空间位置上略有不同;统计冗余,采用不同的编码方法对信息进行熵编码,则编码整个符号序列的比特数就会不太一样;视觉冗余,人眼的视觉系统是有缺陷的,它并不是对所有的颜色、对比度和频率都能够识别,因此适当的降低图像的精度,人眼并不会察觉到,同时能达到压缩数据量的目的。知道了产生冗余的原因,就可以采用相应的方法进行冗余消除,实现视频压缩,视频压缩编码的原理和出发点就在于最大限度地消除各种冗余。具体来讲,针对不同的冗余,视频压缩编码标准采用不同的策略进行消除,例如,用帧间预测消除时间冗余;用帧内预测消除空间冗余;用变换、量化消除视觉冗余;用熵编码消除统计冗余。
如上所述,视频压缩编码的目的在于节省传输视频的码流或存储视频的空间,视频的处理过程可以包括以下几个步骤:1)视频的采集,视频的采集由摄像机等图像获取设备得到;2)视频的编码,对视频序列进行编码压缩,得到相应的视频码流;3)对编码压缩后的视频码流进行传输或者存储;4)对得到的视频码流进行解码,得到解码后的视频;5)用户利用显示设备对视频进行播放,其中,在第2)步的视频编码主要包括预测(帧内预测和帧间预测)、变换量化和编码。
高效视频编码(High Efficiency Video Coding,简称HEVC)(H.265)技术作为新一代视频编码标准,致力于将编码效率比高级视频编码(AdvancedVideo Coding,简称AVC)提高50%。帧间预测是视频压缩编码中主要的访存和计算瓶颈,为了提高帧间预测的准确性,HEVC标准中增加了合并(merge)预测模式,merge模式是通过对包含多个相邻块的整个运动补偿区域使用单一运动参数级,去除运动参数上的冗余。为了从帧间预测所有merge模式中选出最优的预测模式,需要对所有的预测单元(Prediction Unit,简称PU)进行多点merge模式操作。HEVC标准将宏块从16×16扩展到了64×64,便于高分辨率视频的压缩,同时采用编码单元(Coding Unit,简称CU)、预测单元(Prediction Unit,简称PU)以及变换单元(Transform Unit,简称TU)编码结构来提高编码效率,其中,CU用于编码过程,PU是进行预测的基本单元,TU是进行变换和量化的基本单元。
但是,在目前的实现方案中,是根据图像应用场景设计merge模式,其硬件结构和具体的应用场景紧密耦合,在逻辑实现时,设计固定的PU处理顺序,并通过状态机控制PU的处理,这样会导致PU选择算法固定且单一,当应用场景改变使得PU类型和处理顺序发生变化时,必须进行硬件改动才能适应新的场景,不利于编码系统性能改进和扩展。
发明内容
本发明实施例提供一种可重用的视频编码方法和编码器,以解决PU选择算法固定且单一,当PU处理顺序发生变化时,必须进行硬件改动才能完成PU顺序升级的问题。
第一方面,本发明实施例提供一种可重用的视频编码方法,包括:
获取一帧图像;
根据预先设置的帧间预测参数获取对所述图像进行帧间预测的预测单元的处理顺序,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识,其中,所述帧间预测模式用于指示进行所述帧间预测的选点方式,所述预测单元的位置用于指示所述预测单元在编码单元层中所处的位置,所述预测单元的处理时间控制信息用于指示在所述图像与所述预测单元对应的位置上进行帧间预测的时长;所述预测效果比较算法用于指示比较所述帧间预测的结果的算法,所述下一次预测跳转信息用于指示下一次进行所述帧间预测的所述编码单元层;
按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
结合第一方面,在第一方面的第一种可能的实现方式中,所述按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码,包括:
按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,根据所述帧间预测参数在所述图像与所述预测单元对应的位置上进行帧间预测;
根据所述帧间预测的结果对所述图像进行编码。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,根据所述帧间预测参数在所述图像与所述预测单元对应的位置上进行帧间预测,包括:
按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,并根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;
根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;
根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述帧间预测的结果对所述图像进行编码,包括:
根据所述比较结果确定编码方式并对所述图像进行编码。
结合第一方面、第一方面的第二种至第二种中任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述获取一帧图像之前,还包括:
根据图像应用场景或硬件能力预先设置所述帧间预测参数,并保存所述帧间预测参数。
第二方面,本发明实施例提供一种编码器,包括:处理器、存储器和寻址控制器;
所述存储器,用于存储视频图像和帧间预测参数,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识;
所述处理器,用于从所述存储器中获取一帧图像,根据预先设置的所述帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码;
所述寻址控制器,用于在所述存储器中对所述帧间预测参数进行地址寻址。
结合第二方面,在第二方面的第一种可能的实现方式中,所述寻址寄存器,具体用于根据所述帧间预测参数获取当前处理的编码单元层的基地址、预测单元组合的基地址;累加获取处理过的预测单元的数量;将所述编码单元层的基地址、预测单元组合的基地址以及所述处理过的预测单元的数量进行地址累加,获取待处理的所述帧间预测参数在所述存储器中的地址;
所述处理器,具体用于根据所述待处理的所述帧间预测参数在所述存储器中的地址从所述存储器中获取所述待处理的帧间预测参数,并根据所述待处理的帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
还包括:
触发器,用于触发所述寻址控制器的数量累加以及在所述存储器中寻址。
结合第二方面、第二方面的第一种至第二种中任一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述处理器,具体用于根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果;根据所述比较结果确定编码方式并对所述图像进行编码。
本发明实施例可重用的视频编码方法和编码器,通过将根据图像应用场景和硬件能力预先设计的进行帧间预测的预测单元PU的操作流程形成帧间预测参数,并将该帧间预测参数写入存储器,再读取帧间预测参数获取进行HEVC编码的参数信息,并执行HEVC编码,实现HEVC编码的应用场景与硬件结构的解耦,解决PU选择算法固定且单一,当应用场景改变使得PU类型和处理顺序发生变化时,必须进行硬件改动才能适应新的场景,不利于编码系统性能改进和扩展的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明可重用的视频编码方法实施例的流程图;
图2为本发明CU结构示意图;
图3A为本发明PU结构示意图一;
图3B为本发明PU结构示意图二;
图3C为本发明PU结构示意图三;
图3D为本发明PU结构示意图四;
图4为本发明PU组合方式示意图;
图5为本发明PU执行顺序示意图;
图6为本发明帧间预测参数数据格式示意图;
图7为本发明编码器实施例一的结构示意图;
图8为本发明编码器实施例二的结构示意图;
图9为本发明编码器实施例三的结构示意图;
图10为本发明编码器的读地址控制模块结构示意图;
图11为本发明编码器的比较算法模块结构示意图;
图12为本发明编码器实现高效视频编码的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明为了提高HEVC视频压缩编码的实时性,在编码器上通过现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或专用集成电路(Application Specific Integrated Circuit,简称ASIC)实现HEVC视频压缩编码,FPGA或ASIC的可编程的特性使得merge模式的帧间预测过程是可重用的,根据应用场景和硬件能力可以实时调整PU的个数以及顺序,可以满足不同的应用方案,将硬件结构从应用场景中解耦出来,极大的提高了merge实现的灵活性。
图1为本发明可重用的视频编码方法实施例的流程图,如图1所示,本实施例的方法可以包括:
步骤101、获取一帧图像;
本实施例中,图像已经通过摄像装置拍摄并保存下来,编码器可以直接从本地的存储器中获取到图像。
步骤102、根据预先设置的帧间预测参数获取对图像进行帧间预测的预测单元的处理顺序;
本实施例中,帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识,其中,帧间预测模式用于指示进行帧间预测的选点方式,预测单元的位置用于指示预测单元在编码单元层中所处的位置,预测单元的处理时间控制信息用于指示在图像与预测单元对应的位置上进行帧间预测的时长;预测效果比较算法用于指示比较帧间预测的结果的算法,下一次预测跳转信息用于指示下一次进行帧间预测的编码单元层。
为了更有效的进行数据的压缩,HEVC采用了更加灵活的方式表示块结构:CU、PU以及变换单元,其中,CU是进行预测、变换、量化和熵编码的基本单元,最大的CU是64×64,最小的编码单元是8×8,HEVC采取四叉树迭代的方式进行CU的划分,CU的形状必须是正方形的,即四叉树划分的四个块的大小是完全一样的,图2为本发明CU结构示意图,如图2所示,一共包括四层CU层,分别是64×64、32×32、16×16以及8×8;PU是进行预测的基本单元,它的形状可以不是正方形的,一个CU可以包括一个或者多个PU,图3A为本发明PU结构示意图一,图3B为本发明PU结构示意图二,图3C为本发明PU结构示意图三,图3D为本发明PU结构示意图四,如图3A-3D所示,进行帧间预测的PU包括2N×2N、2N×N、N×2N和N×N四种模式,其中,N表示PU所处的CU层的规格的二分之一,例如当前PU处于的CU层为32×32,则PU2N×2N为32×32,PU2N×N为32×16、PU N×2N为16×32、PU N×N为16×16;变换单元是进行变换和量化的基本单元,它的大小可以从4×4到32×32,必须是正方形的,在帧间预测时,变换单元的大小可以大于PU的大小,但是不能超过CU的大小。
merge模式是对PU进行处理,需要考虑不同PU处理的顺序。图4为本发明PU组合方式示意图,如图4所示,考虑到应用场景和硬件能力的不同,需要的merge性能不同,导致处理的PU个数和顺序也不同,为了支持PU选择的广泛性,每一层CU可以包含7种PU组合方式:1)PU2N×2N;2)PU2N×N;3)PUN×2N;4)PU2N×2N和PUN×2N;5)PU2N×2N和PU2N×N;6)PUN×2N和PU2N×N;7)PUN×2N、PU2N×N以及PU2N×2N。每一种组合方式都可以对应多种PU的操作流程,包括PU0、PU1、PU2……PUn,n可以是任意一个大于0的整数,即上述7中组合方式,无论选择哪种组合方式进行帧间预测,在确定PU的处理顺序时可以根据应用场景、硬件能力,以及编码精度等需求,具体地对该组合中的PU模式进行排序。
例如,图5为本发明PU执行顺序示意图,CU层为32×32,选择的PU组合为PU16×32和PU32×32,即上述第4)种组合方式,那么对应于CU32×32,PU2N×2N和PUN×2N组合方式中的对PU的处理可以按照图5所示的排序进行,空白部分为需要空闲出一定的周期数,C1为PU16×32,C2为PU32×32,C1-0合并(即merge处理)0表示在预先选择的第一个点做第一次PU16×32的merge处理,C1-0合并1表示在预先选择的第二个点做第一次PU16×32的merge处理,C2合并0表示在预先选择的第一个点做PU32×32的merge处理,C2合并1表示在预先选择的第二个点做PU32×32的merge处理,C1-1合并0表示在预先选择的第一个点做第二次PU16×32的merge处理,C1-1合并1表示在预先选择的第二个点做第二次PU16×32的merge处理。图5显示了针对CU32×32层所做的PU处理顺序,根据该顺序即可实现对CU32×32的HEVC编码,可选的,在确定了第4)种组合方式后,还可以以其它的PU顺序进行HEVC编码,另外,根据需求的不同,也可以确定其它的组合方式,例如第1)种、第3)种等,进而可以对应不同的PU顺序,这里最终确定的PU顺序与应用场景和硬件能力相关,考虑到不同场景对视频的像素要求、图像清晰度和连贯性等因素,以及硬件最大可以承受的数据处理极限,设计出适合的PU顺序,而该PU顺序并不影响硬件结构,即本实施例中的硬件结构可以是通用的,通过将编码程序写入FPGA或ASIC中,再由编码程序读取存储器获取到预设的处理顺序,并最终根据该顺序进行HEVC编码达到预期的编码效果。
步骤103、按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
本实施例中,在根据图像应用场景和硬件能力确定了PU的组合方式和处理顺序后,编码器根据该顺序形成帧间预测参数,该帧间预测参数包括HEVC编码操作流程中的每一个选择出来的PU对应的数据信息。具体来讲,根据上述确定PU顺序的过程,HEVC编码器获取到后续进行HEVC编码的操作流程,操作流程中包括多少个PU个数,该帧间预测参数中就包括多少个数据信息,每个数据信息即HEVC编码器处理到哪个PU时,该PU对应的指令,其中,帧间预测模式表示merge选点的方式;PU的位置表示当前PU的位置;PU类型表示PU所在的CU层、PU类型和PU索引号;PU处理时间控制信息表示当前PU的处理时间计数器;预测效果比较算法表示在实际应用中会权衡不同性能和不同逻辑实现代价,选择当前PU在不同阶段采用不同的比较方法,主要包括绝对差值和(Sum of Absolute Differences,简称:SAD)算法、绝对传播差值和(Sum of Absolute Transformed Difference,简称:SATD)以及平方差值和(Sum of Squared Differences,简称:SSD)算法;下一次预测跳转信息表示处理完当前PU后下一次要处理的PU所在的CU层信息;结束标识表示当前PU操作是否为最后一个PU。
HEVC编码器将预先设置的帧间预测参数通过总线写入存储器,保存在本地,以便于后续HEVC编码器的FPGA执行编码程序时,可以从存储器中直接读取到当前处理的PU的信息。
HEVC编码器从存储器中读取帧间预测参数,获取到对图像进行帧间预测的PU的处理顺序,再根据该PU处理顺序依次在图像与PU对应的位置上进行帧间预测,并根据帧间预测的结果对图像进行编码。HEVC编码器的FPGA在运行编码程序时,从存储器中读取帧间预测参数,每一次的读取可以获取到当前PU的信息以及下一个PU的跳转信息,根据这些PU的信息编码程序即可实现HEVC编码,这样反复的执行过程即可将预先设计的操作流程中的所有PU的逐个处理完毕,达到预期的HEVC编码效果。
本实施例,通过将根据图像应用场景和硬件能力预先设计的进行帧间预测的预测单元PU的操作流程形成帧间预测参数,并将该帧间预测参数写入存储器,再读取帧间预测参数获取进行HEVC编码的参数信息,并执行HEVC编码,实现HEVC编码的应用场景与硬件结构的解耦,解决PU选择算法固定且单一,当应用场景改变使得PU类型和处理顺序发生变化时,必须进行硬件改动才能适应新的场景,不利于编码系统性能改进和扩展的问题。
进一步的,图6为本发明帧间预测参数数据格式示意图,如图6所示,帧间预测参数中包括的操作流程中的每一个PU对应的数据信息可以是以32比特的数据格式存储在存储器中,这32比特中,5-0比特:共6比特,表示PU的位置,其中,5-4比特表示当前PU在CU32×32层的具体位置,例如00表示左上角的CU32×32,01表示右上角的CU32×32,10表示左下角的CU32×32,11表示右下角的CU32×32;3-2比特表示当前PU在CU16×16层的具体位置;1-0比特表示当前PU在CU8×8层的具体位置。13-8比特:共6比特,表示PU的类型,其中,13-12比特表示当前处理的CU层,例如00表示当前处理的是CU64×64,01表示当前处理的是CU32×32,10表示当前处理的是CU16×16,11表示当前处理的是CU8×8;11-10比特表示PU的模式,例如00表示2N×2N;01表示PU2N×N;10表示PUN×2N;11表示PUN×N;9-8比特表示PU索引。17-16比特:共2比特,表示下一次预测跳转信息,例如00表示下一次处理的是CU64×64;01表示下一次处理的是CU32×32;10表示下一次处理的是CU16×16;11表示下一次处理的是CU8×8。19-18比特:共2比特,表示预测效果比较算法,例如00表示SAD算法;01表示SATD算法;10表示SSD算法。20比特:共1比特,表示结束标识。23-21比特:共3比特,表示帧间预测模式。31-24:共8比特,表示时间控制。需要说明的是,图6所示的数据信息格式为本发明所采用的数据格式的一个示例,该数据格式还可有其它的比特位设置方法,此处不做具体限定。
进一步的,上述方法实施例的步骤103中按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码,具体的实现方法可以是:按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,根据所述帧间预测参数在所述图像与所述预测单元对应的位置上进行帧间预测;根据所述帧间预测的结果对所述图像进行编码。
具体来讲,HEVC编码器按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,并根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果;根据所述比较结果确定编码方式并对所述图像进行编码。
HEVC编码器在从存储器读取了帧间预测参数后,即可根据帧间预测参数中的数据信息获取PU的处理顺序,HEVC编码器根据该顺序依次在图像与预测单元对应的位置上进行帧间预测,即HEVC编码器的程度在读到PU的数据信息后,例如图6所示的数据信息,根据13-8比特和5-0比特的信息即可获知当前PU的位置、CU层、以及在该CU层采用的PU模式以及merge处理的点,根据这些信息HEVC编码器即可在图像上与该PU相对应位置处的帧间预测。当HEVC编码器处理完当前的PU后,根据25-24比特的结束标识确定HEVC编码是否结束,如果没有结束,则HEVC编码器根据17-16比特的下一次预测跳转信息获取下一次进行帧间预测的跳转信息,即下一次处理的CU层,需要说明的是,下一次处理的PU的位置顺序是固定的,例如四个CU32×32,那么在CU32×32层处理的顺序可以是左上角、右上角、左下角、右下角的顺序,比较特殊的是CU64×64,只有一个因此不存在处理顺序。HEVC编码器可以继续根据下一个PU的数据信息进行帧间预测,每一层的CU对应的PU顺序是相同的。如果25-24比特表示结束编码,HEVC编码器结束编码,需要说明的是,如果当前是CU8×8,则结束标识需要和CU16×16、CU32×32、CU64×64的结束标识同时有效,如果当前是CU16×16,则结束标识需要和CU32×32、CU64×64的结束标识同时有效,如果当前是CU32×32,则结束标识需要和CU64×64的结束标识同时有效,如果当前是CU64×64,则直接结束即可。HEVC编码器在对图像进行帧间预测时根据预测效果比较算法对预测的结果进行处理,以获取该图像最佳的编码方式,然后根据编码方式对图像进行编码。
进一步的,上述方法实施例的步骤101之前,还包括:根据图像应用场景或硬件能力预先设置所述帧间预测参数,并保存所述帧间预测参数。
具体来讲,视频的编码与应用场景或编码器的硬件能力密切相关,因此在预设帧间预测编码参数时,需要考虑这两个因素。当视频的应用场景发生变化,意味着对视频的清晰度、连贯性等要求都发生了变化,此时需要调整PU的操作流程,另外硬件能力变化,表示硬件处理数据的能力升高或降低,无论是哪种变化,也需要调整PU的操作流程,上述两种情况,出现至少一种情况就需要根据具体的变化更新进行帧间预测的PU的操作流程,并生成新的帧间预测参数。
图7为本发明编码器实施例一的结构示意图,如图7所示,本实施例的编码器可以包括:处理器11、存储器12以及寻址控制器13,其中,存储器12,用于存储视频图像和帧间预测参数,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识;处理器11,用于从所述存储器中获取一帧图像,根据预先设置的所述帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行;寻址控制器13,用于在所述存储器中对所述帧间预测参数进行地址寻址。
进一步的,寻址控制器13,具体用于根据所述帧间预测参数获取当前处理的编码单元层的基地址、预测单元组合的基地址;累加获取处理过的预测单元的数量;将所述编码单元层的基地址、预测单元组合的基地址以及所述处理过的预测单元的数量进行地址累加,获取待处理的所述帧间预测参数在所述存储器中的地址;处理器11,具体用于根据所述待处理的所述帧间预测参数在所述存储器中的地址从所述存储器中获取所述待处理的帧间预测参数,并根据所述待处理的帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
本实施例的装置,可以用于执行图1~图6任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本发明编码器实施例二的结构示意图,如图8所示,本实施例的编码器在图7所示编码器结构的基础上,进一步地,还可以包括:触发器14,用于触发所述寻址控制器的数量累加以及在所述存储器中寻址。
本实施例的装置,可以用于执行图1~图6中任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步的,处理器11,具体用于根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果;根据所述比较结果确定编码方式并对所述图像进行编码。
下面采用两个具体的实施例,对图7和图8所示装置实施例的技术方案进行详细说明。
图9为本发明编码器实施例三的结构示意图,如图9所示,本实施例的编码器可以包括:存储模块11、读地址控制模块12、地址控制状态机模块13、比较算法模块14、总线15以及读取参数获取模块16。帧间预测参数通过总线15写入存储模块11中,地址控制状态机模块13触发信息的读取,即触发读地址控制模块12在存储模块11中读取帧间预测参数,读地址控制模块12收到读取触发后,根据帧间预测参数获取读取的地址,使得存储模块11输出该地址中存储的帧间预测参数,包括PU类型、PU位置、预测效果比较算法等,比较算法模块14根据预测效果比较算法执行相应的算法,并输出计算结果,有了上述输出信息,HEVC编码器的程序即可完成HEVC编码。
进一步的,图10为本发明编码器的读地址控制模块结构示意图,如图10所示,图9中的读地址控制模块12包括:CU层选择模块21、PU组合选择模块22、当前PU确定模块23以及地址累加模块24,其中,CU层选择模块21,用于根据帧间预测参数获取当前处理的CU层的基地址;PU组合选择模块22,用于根据帧间预测参数获取当前使用的PU组合对应的基地址;当前PU确定模块23,用于根据PU流程的计数情况确定当前处理的PU流程地址;地址累加模块24,用于将当前处理的CU层的基地址、当前使用的PU组合对应的基地址、当前处理的PU流程地址进行累加,获取在存储模块中的读取地址。读地址控制模块将上述三者累加,向存储模块输出当前的读取地址,以实现存储模块的读取操作。
进一步的,图11为本发明编码器的比较算法模块结构示意图,如图11所示,图9中的比较算法模块14包括:插值模块31、第一算法模块32、第二算法模块33、第三算法模块34以及算法结果处理模块35,其中插值模块31,用于获取视频的残差值;第一算法模块32、第二算法模块33以及第三算法模块34分别用于实现三种失真度最优化算法,这三种算法例如可以是SAD算法、SATD算法和SSD算法;算法结果处理模块35,用于根据当前PU执行的数据格式中的预测效果比较算法对相应算法的计算结果进行处理。
图12为本发明编码器实现高效视频编码的流程图,如图12所示,本实施例的流程适用于图7~图11所示编码器实施例的结构,该流程包括:
s101、处理器将预先设计的帧间预测参数通过总线写入存储器;
s102、处理器校验写入存储器的帧间预测参数;
s103、处理器开始进行视频编码;
s104、处理器根据寻址控制器从存储器中读取帧间预测参数;
s105、处理器根据帧间预测参数对图像进行帧间预测;
本实施例中,处理器可以根据PU的组合划分处理分支,例如,图10所示的PU组合包括了七种模式,每一种模式可以对应一个处理分支,处理器在进行帧间预测时,只要根据帧间预测参数获取了当前的PU组合,即可在相应的分支里进行处理。
s106、处理器完成当前处理的最大编码单元对应的图像区域的帧间预测;
本实施例中,图像按照最大编码单元的规格被分成多个区域,每个区域根据帧间预测参数中的PU处理顺序进行帧间预测,处理器分别对每个区域按照预设的PU顺序进行处理。
s107、处理器判断是否对图像全部处理完毕,否则转去s108,是则转去s109;
本实施例中,处理器在处理完一个最大编码单元对应的图像区域后,先判断是否已经处理完整帧图像,即是否还有没处理的图像区域,如果已经处理完毕,则处理器结束视频编码,并开始针对新的图像预设帧间预测参数,再编码,如果还没有处理完毕,则处理器继续读取帧间预测参数对下一个图像区域进行帧间预测。
s108、处理器开始对下一个最大编码单元对应的图像区域进行帧间预测,转去s104;
s109、处理器结束视频编码,转去s101。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种可重用的视频编码方法,其特征在于,包括:
获取一帧图像;
根据预先设置的帧间预测参数获取对所述图像进行帧间预测的预测单元的处理顺序,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识,其中,所述帧间预测模式用于指示进行所述帧间预测的选点方式,所述预测单元的位置用于指示所述预测单元在编码单元层中所处的位置,所述预测单元的处理时间控制信息用于指示在所述图像与所述预测单元对应的位置上进行帧间预测的时长;所述预测效果比较算法用于指示比较所述帧间预测的结果的算法,所述下一次预测跳转信息用于指示下一次进行所述帧间预测的所述编码单元层;
按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
2.根据权利要求1所述的方法,其特征在于,所述按照所述预测单元的处理顺序依次在所述图像与所述预测单元对应的位置上进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码,包括:
按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,根据所述帧间预测参数在所述图像与所述预测单元对应的位置上进行帧间预测;
根据所述帧间预测的结果对所述图像进行编码。
3.根据权利要求2所述的方法,其特征在于,所述按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,根据所述帧间预测参数在所述图像与所述预测单元对应的位置上进行帧间预测,包括:
按照所述预测单元的处理顺序依次获取待处理的所述预测单元对应的所述帧间预测参数,并根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;
根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;
根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述帧间预测的结果对所述图像进行编码,包括:
根据所述比较结果确定编码方式并对所述图像进行编码。
5.根据权利要求1~4中任一项所述的方法,其特征在于,所述获取一帧图像之前,还包括:
根据图像应用场景或硬件能力预先设置所述帧间预测参数,并保存所述帧间预测参数。
6.一种编码器,其特征在于,包括:处理器、存储器和寻址控制器;
所述存储器,用于存储视频图像和帧间预测参数,所述帧间预测参数包括帧间预测模式、预测单元的位置、预测单元的类型、预测单元的处理时间控制信息、预测效果比较算法、下一次预测跳转信息以及结束标识;
所述处理器,用于从所述存储器中获取一帧图像,根据预先设置的所述帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码;
所述寻址控制器,用于在所述存储器中对所述帧间预测参数进行地址寻址。
7.根据权利要求6所述的编码器,其特征在于,所述寻址寄存器,具体用于根据所述帧间预测参数获取当前处理的编码单元层的基地址、预测单元组合的基地址;累加获取处理过的预测单元的数量;将所述编码单元层的基地址、预测单元组合的基地址以及所述处理过的预测单元的数量进行地址累加,获取待处理的所述帧间预测参数在所述存储器中的地址;
所述处理器,具体用于根据所述待处理的所述帧间预测参数在所述存储器中的地址从所述存储器中获取所述待处理的帧间预测参数,并根据所述待处理的帧间预测参数对所述图像进行帧间预测,并根据所述帧间预测的结果对所述图像进行编码。
8.根据权利要求6或7所述的编码器,其特征在于,还包括:
触发器,用于触发所述寻址控制器的数量累加以及在所述存储器中寻址。
9.根据权利要求6~8中任一项所述的编码器,其特征在于,所述处理器,具体用于根据所述预测单元的位置、预测单元的类型确定所述预测单元在所述图像中对应的位置;根据所述帧间预测模式、预测单元的处理时间控制信息在所述图像中对应的位置上进行所述帧间预测,并通过所述预测单元的处理时间控制信息确定所述进行所述帧间预测的时长;根据所述预测效果比较算法确定比较所述帧间预测的结果的算法,并根据所述预测效果比较算法对所述帧间预测的结果进行处理获取比较结果;根据所述比较结果确定编码方式并对所述图像进行编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410219372.3A CN103974069B (zh) | 2014-05-22 | 2014-05-22 | 可重用的视频编码方法和编码器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410219372.3A CN103974069B (zh) | 2014-05-22 | 2014-05-22 | 可重用的视频编码方法和编码器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103974069A true CN103974069A (zh) | 2014-08-06 |
CN103974069B CN103974069B (zh) | 2017-06-20 |
Family
ID=51243040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410219372.3A Active CN103974069B (zh) | 2014-05-22 | 2014-05-22 | 可重用的视频编码方法和编码器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103974069B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104363458A (zh) * | 2014-10-29 | 2015-02-18 | 复旦大学 | 一种用于hevc标准中帧内预测的预测单元的硬件编址寻址方法 |
CN105791866A (zh) * | 2014-12-24 | 2016-07-20 | 北京数码视讯科技股份有限公司 | 视频编码中间数据获取方法、设备及系统 |
CN107613298A (zh) * | 2017-09-27 | 2018-01-19 | 郑州云海信息技术有限公司 | 基于OpenCL的VP8视频的帧间预测方法及系统 |
CN111757104A (zh) * | 2020-06-29 | 2020-10-09 | 北京百度网讯科技有限公司 | 一种图像编码方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101415122A (zh) * | 2007-10-15 | 2009-04-22 | 华为技术有限公司 | 一种帧间预测编解码方法及装置 |
US20090285285A1 (en) * | 2007-08-21 | 2009-11-19 | Kabushiki Kaisha Toshiba | Information processing apparatus and inter-prediction mode determination method |
US8379726B2 (en) * | 2007-08-29 | 2013-02-19 | Sony Corporation | Coding apparatus, coding method, decoding apparatus, and decoding method |
CN103369316A (zh) * | 2012-03-29 | 2013-10-23 | 索尼公司 | 图像处理设备和方法 |
-
2014
- 2014-05-22 CN CN201410219372.3A patent/CN103974069B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090285285A1 (en) * | 2007-08-21 | 2009-11-19 | Kabushiki Kaisha Toshiba | Information processing apparatus and inter-prediction mode determination method |
US8379726B2 (en) * | 2007-08-29 | 2013-02-19 | Sony Corporation | Coding apparatus, coding method, decoding apparatus, and decoding method |
CN101415122A (zh) * | 2007-10-15 | 2009-04-22 | 华为技术有限公司 | 一种帧间预测编解码方法及装置 |
CN103369316A (zh) * | 2012-03-29 | 2013-10-23 | 索尼公司 | 图像处理设备和方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104363458A (zh) * | 2014-10-29 | 2015-02-18 | 复旦大学 | 一种用于hevc标准中帧内预测的预测单元的硬件编址寻址方法 |
CN104363458B (zh) * | 2014-10-29 | 2017-10-10 | 复旦大学 | 一种用于hevc标准中帧内预测的预测单元的硬件编址寻址方法 |
CN105791866A (zh) * | 2014-12-24 | 2016-07-20 | 北京数码视讯科技股份有限公司 | 视频编码中间数据获取方法、设备及系统 |
CN107613298A (zh) * | 2017-09-27 | 2018-01-19 | 郑州云海信息技术有限公司 | 基于OpenCL的VP8视频的帧间预测方法及系统 |
CN111757104A (zh) * | 2020-06-29 | 2020-10-09 | 北京百度网讯科技有限公司 | 一种图像编码方法、装置、电子设备及存储介质 |
CN111757104B (zh) * | 2020-06-29 | 2022-11-18 | 北京百度网讯科技有限公司 | 一种图像编码方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103974069B (zh) | 2017-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7237874B2 (ja) | イメージ予測方法および装置 | |
RU2699258C2 (ru) | Способ прогнозирования изображения и устройство прогнозирования изображения | |
CN101127902B (zh) | 具有用于运动向量存储的地址管理机制的帧间预测处理器 | |
CN110024384A (zh) | 基于帧间预测模式处理视频的方法和用于该方法的设备 | |
CN108781284A (zh) | 具有仿射运动补偿的视频编解码的方法及装置 | |
CN105141955A (zh) | 图像解码方法和图像解码设备 | |
GB2519616A (en) | Method and apparatus for displacement vector component prediction in video coding and decoding | |
CN103430545A (zh) | 用于高效视频编码的内容适应性运动补偿滤波 | |
CN103748880A (zh) | 图像序列的编码方法和装置及图像序列的解码方法和装置 | |
JP2010171729A (ja) | 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法 | |
KR20190107944A (ko) | 복원 영상에 대한 필터링을 수행하는 영상 처리 장치 및 이의 필터링 방법 | |
US20180199058A1 (en) | Video encoding and decoding method and device | |
KR20220003020A (ko) | 인코딩 및 디코딩 방법, 장치, 및 기기 | |
CN103974069A (zh) | 可重用的视频编码方法和编码器 | |
JP2007189276A (ja) | 画像圧縮装置及び画像圧縮プログラム | |
CN102113327B (zh) | 图像编码装置、方法、集成电路 | |
CN103596003B (zh) | 高性能视频编码的帧间预测快速模式选择方法 | |
CN102685506B (zh) | 帧内预测的方法和预测装置 | |
KR20240153692A (ko) | 머신 분석을 위한 비트스트림 포맷을 인코딩 또는 디코딩하는 npu | |
CN101005627A (zh) | 图像译码方法、图像译码装置 | |
JPWO2008072500A1 (ja) | 動画像符号化装置および動画像復号装置 | |
CN104104947B (zh) | 一种视频编码方法和装置 | |
CN118784857A (zh) | 神经处理单元、vcm解码器和vcm编码器 | |
CN103828366A (zh) | 基于图样信息的自适应滤波 | |
CN102801980A (zh) | 一种用于可伸缩视频编码的解码装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220211 Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province Patentee after: Huawei Cloud Computing Technologies Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |