CN102291582B - 一种基于运动补偿精化的分布式视频编码方法 - Google Patents
一种基于运动补偿精化的分布式视频编码方法 Download PDFInfo
- Publication number
- CN102291582B CN102291582B CN201110281532.3A CN201110281532A CN102291582B CN 102291582 B CN102291582 B CN 102291582B CN 201110281532 A CN201110281532 A CN 201110281532A CN 102291582 B CN102291582 B CN 102291582B
- Authority
- CN
- China
- Prior art keywords
- frame
- motion
- side information
- motion compensation
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种基于运动补偿精化的分布式视频编码方法,包括以下步骤:(1)在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;(2)在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧。本发明设计合理,采用改进的三维递归搜索运动方法(3DRS),能够有效地善初始边信息(SI)质量;同时采用时空边界匹配算法(STBMA)实现对边信息的精化,其充分利用空间和时间的平滑性能来获取更精确的运动矢量,具有更好的率失真性能。
Description
技术领域
本发明属于视频压缩技术领域,尤其是一种基于运动补偿精化的分布式视频编码方法。
背景技术
随着网络技术、无线技术和计算机技术的飞速发展,近来涌现出许多具有崭新特点的多媒体应用设备,如无线视频传感器监控网络、移动摄像手机和便携式摄像机等,这些多媒体应用设备在存储容量、计算能力和功率资源等方面都受到很大的限制,需要简单的编码器以节省功率。
分布式视频编码(Distributed Video Coding,DVC)将耗时耗功率的运动估计/补偿从编码端移到解码端,具有与传统的帧内编码方式相似的低编码复杂度以及远远高于帧内压缩性能的特点,为以上应用场合提供了很好的解决方案。DVC是基于Slepian和Wolf提出的分布式无损编码理论与Wyner和Ziv提出的使用解码端边信息的有损编码理论,前者的主要思想是对视频帧在编码端进行独立编码而在解码端进行联合译码,这样就避免了在编码端进行帧间预测编码,从而降低编码端的复杂度;后者的主要思想是在解码端使用已译码的视频帧来产生边信息,使用边信息来利用当前帧与边信息之间的相关性来对当前帧进行译码。目前比较典型的分布式视频编解码方案,如图1所示,主要是基于像素域的Wyner-Ziv视频编解码框架、基于DCT变换域的Wyner-Ziv视频编解码框架和PRISM视频编解码框架。前两种编码方案是由斯坦福大学的BerndGirod研究小组提出的,其分布式视频编码方案主要是基于帧层并在解码端通过反馈信道来进行速率控制的;第三种编码方案是由加利福尼亚大学的KannanRamehandran研究小组提出的,其分布式视频编码方案PRISM是根据该视频编码的几个特点命名的,其中P表示高效(Power-efficient),R表示鲁棒(Robust),I表示高压缩率(hIgh-compression),SM表示综合多媒体编码(Syndrome-basedMultimedia coding),PRISM视频编码是基于块层并在编码端进行码率控制的。
DVC的技术难点在于如何在解码端生成精确的边信息。一方面,在Slepian-Wolf压缩环节,边信息越精确,需要的信道码的校验比特越少,因而压缩性能越好;另一方面,在量化重构中,DVC中的量化重构值取期望值E(x|y),当边信息y在x的量化区间时,将y作为x的重构值,否则,在x的量化区间中取与y最接近的值为x的重构,所以说,边信息越精确,量化重构值越接近于主信息的原始值。目前提出了很多算法用来提高DVC系统的性能:Dong YoonKim等提出了一种使用种子块生成边信息的算法,当SI接近于目标图像,在解码端可以取得图像更好的重建图像,从而提高压缩比;Marco Cagnazzo等提出了一个新颖的差分运动估计算法,它可以应用于WZ视频编码方案的解码端,而无需增加编码速率;虽然这些算法可以在一定程度上提高DVC的压缩性能,但是,在仍然存在边信息质量差和率失真性能低等问题。
发明内容
本发明的目的在于克服现有技术的不足,提出一种能够提高边信息质量和率失真性能的基于运动补偿精化的分布式视频编解码方法。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于运动补偿精化的分布式视频编码方法,包括以下步骤:
⑴在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;
所述WZ帧为棋盘格式分割的WZ帧,WZ帧内包括间隔分布的子集X2i 1和X2i 2,且:X2i=X2i 1+X2i 2;
⑵在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧;具体包括以下步骤:
①从编码端传来的信息与Y2i 1一起进行解码得到进而得到一个新的边信息其中,Y2i 1和Y2i 2分别表示X2i 1和X2i 2的边信息,X2i 1和X2i 2分别表示间隔分布的子集X2i 1和X2i 2;
所述时空边界匹配算法用来获取精确的运动矢量,该算法采用如下描述时间和空间平滑特性的失真函数:16
上式中:
其中,α是一个权重参数,取0-1间的一个实数;mvcn是候选运动矢量;是参考帧OUT预测块边界的第j个值;和分别是是当前帧中内边界块和外边界块的第j个Y值;kj(i)是一个比例因子,表示内边界块的第j个预测边界像素的方向;是梯度算子;是运算符,其方向与梯度方向正交;是拉普拉斯算子;
本发明的优点和积极效果是:
本发明设计合理,采用改进的三维递归搜索运动方法(3DRS),能够有效地善初始边信息(SI)质量;同时采用时空边界匹配算法(STBMA)实现对边信息的精化,其充分利用空间和时间的平滑性能来获取更精确的运动矢量,具有更好的率失真性能。
附图说明
图1为传统分布式视频编码框架图;
图2为本发明所提出的分布式视频编码框架图;
图3为基于棋盘格局的WZ帧分类示意图;
图4为三维递归搜索运动方法的空间与时间预测块的相对位置示意图;
图5为时空边界匹配方法(STBMA)中运动补偿块示意图;
图6为实例Foreman序列的RD性能结果图;
图7为实例News序列的RD性能结果图。
具体实施方式
以下结合附图对本发明实施例做进一步详述:
一种基于运动补偿精化的分布式视频编码方法,从两个方面提高分布式视频编解码总体的率失真性能,主要是在解码端使用改进的三维递归运动搜索方法(3DRS)和时空边界匹配算法(Spatio-temporal Boundary MatchingAlgorithm,STBMA)来获得更精确的运动矢量,进而得到较好的边信息。下面详细说明本发明所提出的分布式视频编码方法。
一种基于运动补偿精化的分布式视频编码方法,如图2所示,包括以下步骤:
步骤1:在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;
在本步骤中,将编码段将视频序列分成两种帧格式,其中关键帧采用H.264帧内编码,WZ帧为棋盘格式分割的WZ帧,如图3所示,WZ帧内包括间隔分布的子集X2i 1和X2i 2,且:X2i=X2i 1+X2i 2。
步骤2:在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法(3DRS)产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧。
在本步骤中,使用改进的三维递归运动搜索方法用于对解码端运动矢量进行搜索,该三维递归运动搜索方法可以作出更为精确的运动估计和运动补偿算法,从而有效提高边信息的质量,用于对解码端运动矢量的搜索。与全搜索运动估计相比,3DRS获得这个运动域是一个更接近于真实运动场的运动矢量。3DRS包括以下步骤:
在进行递归搜索时,设关键帧为当前预测帧,为参考帧,CSa和CSb为关键帧中的初始参考块,CSc、CSd、CSe和CSf为关键帧中的初始参考块,此6个候选预测参考块的位置如图4所示,其具体递归搜索过程如下:
⑴计算初始参考块CSa及其四个邻块与当前预测块的绝对误差和(SAD)值,计算公式如下:
将SAD最小的块做为新的参考块并标为CSa,重复上述过程(迭代)直到CSa位置不再改变;
⑵对其他5个候选参考块CSb、CSc、CSd、CSe和CSf分别重复第一步的动作直到其位置都不再移动,此时认为6个候选预测分支都已聚合;
⑶在所有的分支都收敛后,6个分支的最小SAD值是块的运动矢量,此时,编码端只需要计算一个来自解码端的候选运动矢量,拥有最小SAD值的参考块对应运动矢量即为当前预测块的前向运动矢量,记为Vf。
⑶在获得了前向运动矢量和后向运动矢量后,基于连续帧运动矢量平滑的假设,按照如下公式计算处于可信度较低区域的边信息宏块的新运动矢量V:
在解码处理时,采用运动补偿内插法生成边信息解码WZ帧,具体包括以下处理过程:
⑴从编码端传来的信息与Y2i 1一起进行解码得到进而得到一个新的边信息其中,Y2i 1和Y2i 2分别表示X2i 1和X2i 2的边信息,X2i 1和X2i 2分别表示间隔分布的子集X2i 1和X2i 2;
在上述处理过程中,采用时空边界匹配算法用来获取精确的运动矢量。由于一般的边界匹配算法只考虑了空间的平滑性,而时空边界匹配算法则充分运用了时间和空间的平滑性,来获取精确的运动矢量,以达到精化边信息的目的。该算法定义了一种描述时间和空间平滑特性的失真函数,该失真因素由空间失真和时间失真两个因素决定,该失真函数定义如下:
上式中:α是一个权重参数,取0-1间的一个实数。
如图5所示,和定义如下:
其中:
上式中,mvcn是候选运动矢量;是参考帧OUT预测块边界的第j个值;和分别是是当前帧中内边界块和外边界块的第j个Y值;kj(i)是一个比例因子,表示内边界块的第j个边界像素的方向;是梯度算子;是运算符,其方向与梯度方向正交;是拉普拉斯算子。
是用来度量候选MV时间连续性的,的值小表示候选MV的时间连续性比较好。是用来度量候选MV的空间连续性的,的值小表示候选MV的空间连续性比较好。候选MV包括零矢量、参考帧的联合定位MV以及相邻块的MV。使得失真DST最小的MV即是最终的用于边信息运动补偿精化的运动矢量。
下面使用实例对本发明进行验证。实例验证中采用的仿真环境为matlab.R2007b,仿真实验分别选用标准视频序列库中Foreman序列和News序列进行测试,这两个视频序列都采用CIF(352×288)格式。奇数帧被编码为关键帧而偶数帧为WZ帧。权值参数α设定为0.5。
表格1给出了set2的边信息的PSNR。
本发明提出的算法与文献(A.Aaron,S.Rane,E.Setton and B.Girod.“Transform-domain Wyner-Ziv codec for video”,in Proc.SPIE VisualCommunication and Image Processing,San Jose,CA,Jan.2004.)和文献(HongbinLiu,Xiangyang Ji,Debin Zhao,Bo Wu,Wen Gao.“Distributed Video Coding usingblock based checkerboard pattern splitting algorithm”.The26th Picture CodingSymposium2007,PCS2007,Lisbon,Portugal,Nov.2007.)的算法进行了比较。从表1中可以看出,新提出的算法与文献[5]的算法相比可以产生0.7-1.4dB增益,与文献[10]相比可以产生0.1-0.4dB的增益。
图6和图7显示了Foreman和News序列的失真性能。率失真(RD:RateDistortion)曲线只考虑WZ帧亮度分量的平均码率及平均峰值信噪比(PSNR)值。从图中可以看出,本发明提出的方法对于Foreman和News序列都有明显改善。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
Claims (1)
1.一种基于运动补偿精化的分布式视频编码方法,其特征在于:包括以下步骤:
⑴在编码端将视频序列分成关键帧和WZ帧,然后对WZ帧进行DCT变换、量化和Turbo编码;
所述WZ帧为棋盘格式分割的WZ帧,WZ帧内包括间隔分布的子集X2i 1和X2i 2,且:X2i=X2i 1+X2i 2;
⑵在解码端,关键帧采用H.264帧内解码,使用改进的三维递归运动搜索方法产生前向和后向运动补偿图像,然后采用运动补偿内插法生成边信息解码WZ帧;具体包括以下步骤:
①从编码端传来的信息与Y2i 1一起进行解码得到进而得到一个新的边信息其中,Y2i 1和Y2i 2分别表示X2i 1和X2i 2的边信息,X2i 1和X2i 2分别表示间隔分布的子集X2i 1和X2i 2;
所述时空边界匹配算法用来获取精确的运动矢量,该算法采用如下描述时间和空间平滑特性的失真函数:
上式中:
其中,α是一个权重参数,取0-1间的一个实数;mvcn是候选运动矢量;是参考帧外边界块的第j个值;和分别是当前帧中内边界块和外边界块的第j个Y值;kj(i)是一个比例因子,表示内边界块的第j个预测边界像素的方向;是梯度算子;是运算符,其方向与梯度方向正交;是拉普拉斯算子;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110281532.3A CN102291582B (zh) | 2011-09-21 | 2011-09-21 | 一种基于运动补偿精化的分布式视频编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110281532.3A CN102291582B (zh) | 2011-09-21 | 2011-09-21 | 一种基于运动补偿精化的分布式视频编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102291582A CN102291582A (zh) | 2011-12-21 |
CN102291582B true CN102291582B (zh) | 2014-04-23 |
Family
ID=45337653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110281532.3A Expired - Fee Related CN102291582B (zh) | 2011-09-21 | 2011-09-21 | 一种基于运动补偿精化的分布式视频编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102291582B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102611893B (zh) * | 2012-03-09 | 2014-02-19 | 北京邮电大学 | 基于直方图匹配和sad判决的dmvc边信息融合方法 |
CN102724495A (zh) * | 2012-05-04 | 2012-10-10 | 西安电子科技大学 | 基于率失真的Wyner-Ziv帧量化方法 |
CN102769747A (zh) * | 2012-06-29 | 2012-11-07 | 中山大学 | 一种基于并行迭代的分级分布式视频编解码方法及系统 |
CN102905129B (zh) * | 2012-09-29 | 2015-03-18 | 湖北工业大学 | 静止图像的分布式编码方法 |
CN104093030B (zh) * | 2014-07-09 | 2017-12-12 | 天津大学 | 分布式视频编码边信息生成方法 |
CN106331721B (zh) * | 2015-06-15 | 2019-06-28 | 中国科学院深圳先进技术研究院 | 真实运动估计方法 |
CN111741304A (zh) * | 2019-03-25 | 2020-10-02 | 四川大学 | 一种基于运动矢量细化的帧率上变换与hevc相结合的方法 |
CN111010257B (zh) * | 2019-12-18 | 2022-06-17 | 西南大学 | 一种基于分布式源编码的数据聚合及编码速率分配方法 |
CN112188210A (zh) * | 2020-09-27 | 2021-01-05 | 铜仁学院 | 一种采用深度信念网络的dvc边信息求取方法 |
CN115767108B (zh) * | 2022-10-20 | 2023-11-07 | 哈尔滨工业大学(深圳) | 一种基于特征域匹配的分布式图像压缩方法、系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101860748A (zh) * | 2010-04-02 | 2010-10-13 | 西安电子科技大学 | 基于分布式视频编码的边信息生成系统及方法 |
CN102137263A (zh) * | 2011-05-09 | 2011-07-27 | 松日数码发展(深圳)有限公司 | 基于cnm关键帧分类的分布式视频编码及解码方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070286277A1 (en) * | 2006-06-13 | 2007-12-13 | Chen Xuemin Sherman | Method and system for video compression using an iterative encoding algorithm |
-
2011
- 2011-09-21 CN CN201110281532.3A patent/CN102291582B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101860748A (zh) * | 2010-04-02 | 2010-10-13 | 西安电子科技大学 | 基于分布式视频编码的边信息生成系统及方法 |
CN102137263A (zh) * | 2011-05-09 | 2011-07-27 | 松日数码发展(深圳)有限公司 | 基于cnm关键帧分类的分布式视频编码及解码方法 |
Non-Patent Citations (2)
Title |
---|
侯萌洁.《分布式视频编码中的信道建模及边信息改进算法研究》.《中国优秀硕士学位论文全文数据库,信息科技辑》.2011,(第09期),第7-8,34-36,24-27页. * |
卿粼波等.《基于迭代译码算法的分级分布式视频编码》.《山东大学学报(工学版)》.2011,第41卷(第2期),58-61. * |
Also Published As
Publication number | Publication date |
---|---|
CN102291582A (zh) | 2011-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102291582B (zh) | 一种基于运动补偿精化的分布式视频编码方法 | |
CN102137263B (zh) | 基于cnm关键帧分类的分布式视频编码及解码方法 | |
US8582904B2 (en) | Method of second order prediction and video encoder and decoder using the same | |
CN102026000B (zh) | 像素域-变换域联合的分布式视频编码系统 | |
CN101835044B (zh) | 一种频率域分布式视频编码中的分类组合方法 | |
CN103248895B (zh) | 一种用于hevc帧内编码的快速模式估计方法 | |
CN101860748A (zh) | 基于分布式视频编码的边信息生成系统及方法 | |
CN102263951B (zh) | 一种快速的分形视频压缩与解压缩方法 | |
CN102598670A (zh) | 参考多个帧对图像进行编码/解码的方法和设备 | |
CN103442228B (zh) | 从h.264/avc标准到hevc标准的快速帧内转码方法及其转码器 | |
CN103327325A (zh) | 基于hevc标准的帧内预测模式快速自适应选择方法 | |
CN102256133A (zh) | 一种基于边信息精化的分布式视频编码及解码方法 | |
Zhang et al. | Adaptive distributed compressed video sensing. | |
CN102088605B (zh) | 可伸缩视频编码快速层间预测选择方法 | |
CN102595132A (zh) | 一种应用于无线传感器网络的分布式视频编解码方法 | |
CN102833536A (zh) | 一种面向无线传感器网络的分布式视频编解码方法 | |
CN107343202B (zh) | 基于附加码率的无反馈分布式视频编解码方法 | |
CN101841705A (zh) | 基于自适应模板的视频无损压缩方法 | |
CN101389032A (zh) | 一种基于图像插值的帧内预测编码方法 | |
Wang et al. | A low complexity compressed sensing-based codec for consumer depth video sensors | |
Soorya et al. | VLSI implementation of lossless video compression technique using New cross diamond search algorithm | |
CN103647969A (zh) | 一种基于对象的快速分形视频压缩与解压缩方法 | |
CN102263954B (zh) | 一种基于对象的快速分形视频压缩与解压缩方法 | |
Cui et al. | Subjective quality optimized intra mode selection for H. 264 I frame coding based on SSIM | |
Zheng et al. | A new multihypothesis prediction scheme for compressed video sensing reconstruction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140423 Termination date: 20140921 |
|
EXPY | Termination of patent right or utility model |