CN101854548B - 一种面向无线多媒体传感器网络的视频压缩方法 - Google Patents
一种面向无线多媒体传感器网络的视频压缩方法 Download PDFInfo
- Publication number
- CN101854548B CN101854548B CN 201010182470 CN201010182470A CN101854548B CN 101854548 B CN101854548 B CN 101854548B CN 201010182470 CN201010182470 CN 201010182470 CN 201010182470 A CN201010182470 A CN 201010182470A CN 101854548 B CN101854548 B CN 101854548B
- Authority
- CN
- China
- Prior art keywords
- frame
- decoding
- coding
- interest
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明是一种面向无线多媒体传感器网络的视频压缩方法,提出一种面向无线多媒体传感器网络的视频压缩方法,来解决视频应用中数据量大的问题。通过使用本发明提出的方法在降低码率的同时提高了解码图像的质量,最终降低传感器节点能耗,从而延长了网络生存周期。该方法采用ROI区分算法,加强对运动剧烈区域和运动边缘区域的编码,并且对解码后的图像采用去块效应滤波后处理,进一步提高解码图像的主观质量,本方法在Wyner-Ziv分布式视频编码方案的基础上,基于图像梯度场域,通过ROI判定准则提取运动剧烈区域并基于Huffman编解码压缩,其余区域则基于LDPC分布式编解码,在降低码率的同时提高解码图像质量,降低节点的处理和传输能耗,实现视频的优化传输,延长整个网络的生存周期。
Description
技术领域
本发明是一种针对无线多媒体传感器网络(Wireless Multimedia SensorNetworks,WMSN)中多媒体数据压缩的技术方案。主要用于解决视频压缩编码的问题,并尽可能提高解码图像的质量,属于计算机无线通信技术领域。
背景技术
近年来,随着无线多媒体通信技术的发展,出现了越来越多的视频应用需求,如:无线多媒体传感器网络、移动可视电话、无线视频监控、无线PC摄像机等。在无线多媒体传感器网络中,视频应用需要处理大量的数据,由于节点计算能力或节点能量受限,传统视频编码标准不再适用于无线视频场合。一种全新的视频编解码框架——分布式视频编码(Distributed Video Coding,DVC)被应用到无线多媒体传感器网络中。
传统的视频编码标准(如MPEG、H.26x)采用了混合编码框架,编码采用运动补偿技术,充分利用视频序列的时间和空间相关性进行预测编码,一般情况下,编码复杂度是解码复杂度的5~10倍。而分布式视频编码具有编码简单、解码复杂的特点。此外,分布式视频编码具有较好的鲁棒性、较高的压缩效率,且易形成分级编码的码流,适用于编码复杂度较低的无线视频场合。
目前比较经典的分布式编解码方案主要包括斯坦福大学Girod和Aaron等提出的Wyner-Ziv视频编码,加州大学伯克利分校的Ramchandran等提出的PRISM视频编码,Zixiang Xiong提出的分层Wyner-Ziv视频编码,Sehgal等提出的state-free分布式视频编码,基于小波编码的分布式视频编码以及多视角分布式视频编码等。Wyner-Ziv分布式视频编码由关键帧(Key帧)和Wyner-Ziv帧(WZ帧)两种帧组成。其中Key帧采用传统的帧内编解码的方式,而WZ帧采用帧内编码和帧间解码相结合的方式。WZ帧编码时,先进行基于块的DCT变换和量化,然后采用Slepian-Wolf编码器进行编码。编码器将编码生成的校验位存储在编码端的缓冲器中,根据解码端的解码反馈请求,将校验位发送给解码器进行纠错解码。解码时,Slepian-Wolf解码器根据解码边信息和接收到的校验位进行解码,根据解码端的解码的正确性,不断反馈请求bit数,编码端缓存器不断发送校验位,直到能够正确解码为止。接着对解码后的系数进行IDCT和反量化以及解码重建。这些方案都是基于turbo或LDPC对Wyner-Ziv帧的所有区域不加区别的编码,这种编码处理方式,适应于运动平缓的情况,但对于运动比较剧烈的区域和运动对象的边缘区域,运动估计和运动补偿技术就不能够准确预测,解码时需要向编码端请求较多的反馈信息,这样不仅增加了码率,而且解码的部分图像仍不够精确。针对该问题,本发明提出了像素域感兴趣区(Region of Intrest,ROI)区分算法。在Wyne-Ziv分布式视频编码理论的基础上,提出了一种改进的Wyner-Ziv分布式视频编码算法,该算法基于图像梯度场,通过感兴趣区域判定准则提取运动剧烈区域并基于熵编码压缩,其余区域则基于LDPC分布式编解码,最终实现视频的优化传输。此外,对解码后的图像进行后处理,采用块效应滤波,进一步提高了图像的质量,满足了人们对图像的主观要求。
发明内容
技术问题:本发明的目的是提出一种面向无线多媒体传感器网络的视频压缩方法,来解决视频应用中数据量大的问题。通过使用本发明提出的方法在降低码率的同时提高了解码图像的质量,最终降低传感器节点能耗,从而延长了网络生存周期。
技术方案:本发明的一种面向无线多媒体传感器网络的视频压缩方法是一种改进性的方法,分布式视频压缩算法主要的任务是将视频应用中较大的数据量进行压缩,从而降低节点的能耗,延长网络生存周期,此外,为了进一步提高解码图像的主观质量,对解码后的图像采用后处理滤波以减少方块效应。
一、体系结构
本方法在Wyner-Ziv分布式视频编码方案的基础上,基于图像梯度场,通过ROI判定准则提取运动剧烈区域并基于Huffman编解码压缩,其余区域则基于LDPC分布式编解码,在降低码率的同时提高解码图像质量,降低节点的处理和传输能耗,实现视频的优化传输,延长整个网络的生存周期。对解码后的图像采用去块效应滤波,提高了图像的主观质量,满足了人们对图像的视觉要求。
本方法基于Wyner-Ziv分布式视频编码方案,将视频序列分为两种不同的帧:关键字(Key Frame,K)和非关键帧(Wyner-Ziv frame,WZ)。对关键帧采用传统的JPEG编码方式,利用ROI区分算法将Wyner-Ziv帧分为ROI区域和非ROI区域,对Wyner-Ziv帧的ROI区域采用Huffman编解码的方式,其余的非ROI区域采用LPDC的编解码方式。对解码后的图像采用去块效应滤波处理,进一步提高了解码图像的质量。
具体步骤如下:(1)在编码端:a)帧分离器:将编码端输入的视频序列分为关键帧(Key帧)和Wyner-Ziv帧(WZ帧);b)空间变换:对W帧进行基于块的离散余弦变换(Discrete Cosine Transform,DCT);c)量化:对每个DCT变换后的系数进行量化;d)编码:使用传统的JPEG技术编码Key帧,利用ROI提取算法将Wyner-Ziv帧区分为ROI区域和非ROI区域:对ROI区域采用Huffman编码,对非ROI区域采用LDPC编码;(2)在解码端:a)生成边信息:使用解码出的帧,进行运动补偿帧内插(或外推)生成边信息;b)相关噪声模型:WZ帧和边信息之间对应的DCT系数的残差统计当作一个拉普拉斯分布进行建模;c)解码:对Key帧,使用传统的JPEG技术解码,对Wyner-Ziv帧的ROI区域采用Huffman解码,其余的非ROI区域采用LDPC解码;d)重构:在边信息的辅助下,重建所有的DCT系数;e)反变换:对重建后的系数执行反离散余弦变换(Inverse Discrete Cosine Transform,IDCT);(3)解码图像后处理:对解码后的图像采用去块效应滤波;(4)帧混合:将解码后的Key帧和WZ帧整合为视频流。
二、方法流程
本方法包括以上所述4个步骤,详细论述如下:
(一):在编码端:
a)帧分离器:视频序列被分为Wyner-Ziv帧(WZ帧)和关键帧(Key帧),其中关键帧周期性的插入,取决于GOP(Group of Pictures)大小。利用帧分离器将视频序列分为不同的帧,对于每个不同的视频序列,由于编码结构的不同,每帧的被赋予的属性不同,因而,采用的编码处理方式也不同。
b)空间变换:基于块的变换,特别地把DCT变换应用到每个WZ帧。依据每个块的DCT系数所处的位置,将整个WZ帧的DCT系数被分为不同的组,从而形成不同的DCT系数集。
c)量化:每个DCT集被统一的量化,这些量化级依赖于所要得到图像的质量。对于一个给定的集合,量化信号的位流被一起分组,形成位平面,然后独立地进行编码。
d)编码:对于Key帧,使用传统的JPEG技术编码,利用ROI区分算法将Wyner-Ziv帧分为ROI区域和非ROI区域:对于ROI区域采用Huffman编码,对于非ROI区域采用LDPC编码。ROI区域采用Huffman编码的过程如下:将待编码的灰度级按出现的次数排序,出现次数多的在前面,次数少的在后面;取出现次数最少的两个数的次数相加,之和作为一个新的出现次数的集合元素并重新排序,新出现的次数在新集合中仍遵循降序规则以确定所处的位置,相加的两个次数最少所对应的灰度级成为Huffman树的一个叶结点,这两个结点构造一个双亲结点,重复该步骤,直到所有的灰度级都被用来构造Huffman树为止;设所有结点的左孩子为“0”,右孩子为“1”,则从根开始,经各中间结点到叶结点的路径代码即是该叶结点的Huffman码。对于非ROI区域的每个DCT集,从最重要的位平面(Most Significant Bit-plane,MSB)进行LDPC编码。对于每个位平面(bit-plane),所生成的奇偶检验信息被存储在缓冲器中,在解码端的请求下,通过反馈机制,不断地发送校验信息。
(二):在解码端:
a)生成边信息:解码端使用最近的已解码帧,通过执行运动补偿帧内插(或外推)的方式生成每个WZ帧的边信息(Side Information,SI)。每个WZ帧的边信息被当作原始WZ帧的一种估计值。估计值的质量越好,LDPC解码端需要改正的“错误”越少,并且向缓冲器所请求的奇偶校验位(或位流)越少。
b)相关噪声模型:在WZ帧和边信息中对应的DCT系数的残差统计被假定当作一个服从拉普拉斯分布的模型,其参数使用离线(off-line)的训练阶段进行初始化估计。
c)LDPC解码:关键帧使用传统的JPEG技术进行解码;WZ帧的ROI区域使用Huffman进行解码复原;对于WZ帧的非ROI区域,一旦知道了边信息DCT系数和一个给定DCT系数的残差统计,每个位平面可以进行LDPC解码(从MSB解码)。在LDPC解码器的请求下,编码器通过反馈信道发送一些奇偶校验消息。为了判定正确的解码某个特定的位平面是否需要更多的校验位,解码器采用一个请求停止标准。当成功地LDPC解码一个DCT集的MSB位平面之后,LDPC解码器以一个统一的的方式处理其余相关的集。一旦所有的DCT集的位平面被成功地LDPC解码,LDPC解码器开始解码下一个集。
d)重构:在LDPC解码后,所有的位平面及每个DCT集被一起分组,以形成解码的量化信号流和每个集。一旦可以获得所有的解码量化信号,在相应的边信息系数的辅助下,便可重构所有的DCT系数。对于所传输的不含WZ位流的DCT系数集由边信息对应的DCT集来代替。
e)反变换:当所有的DCT集被重建以后,执行IDCT,由此便可得到解码的WZ帧。
(三):解码图像后处理:对解码后的图像使用滤波器,从而削弱由量化带来的方块效应。去块效应滤波器是一维滤波器,为了得到二维效果,对一个块要进行两次滤波,第一次是在水平方向,第二次在垂直方向。由于块效应产生的原因是量化误差将原来相邻像素值的连续变化变成了“台阶”变化,看起来就有“伪边缘”的方块现象。去块效应就是在尽量使图像总的能量保持不变的条件下,把那些“台阶”很高的阶跃型的灰度变化重新变成“台阶”很小或接近连续的灰度变化。
(四):帧混合:最后,对于已经正确解码的各帧,即利用传统JPEG编解码Key帧和利用LDPC及Huffman混合编解码的WZ帧,根据在编码端所采用的编码结构GOP的大小,将Key帧和WZ帧按GOP次序混合成视频流,恢复成解码后的视频序列。至此,视频编解码压缩处理结束。
该方法采用ROI区分算法,加强对运动剧烈区域和运动边缘区域的编码,并且对解码后的图像采用去块效应滤波后处理,进一步提高解码图像的主观质量,该方法具体如下:
1)在编码端
a)帧分离器:视频序列被分为关键帧和非关键帧,其中关键帧周期性的插入,取决于图像组的大小,帧分离器将视频序列分为不同的帧,每两个关键帧之间所分配的非关键帧的数目不同,关键帧采用帧内编码,非关键帧采用低密度奇偶校验码编码;
b)空间变换:基于块的变换,特别地把离散余弦变换应用到每个非关键帧上,非关键帧被划分为互不重叠的块,依据每个块的离散余弦变换系数所处的位置,形成不同的离散余弦变换系数集;
c)量化:每个离散余弦变换集被统一的量化,这些量化级依赖于所要得到图像的质量,对于一个给定的集合,量化信号的位流被一起分组,形成位平面,然后独立地进行编码;
d)编码:对于关键帧,使用传统的联合图像专家组进行编码,利用感兴趣区域区分算法将非关键帧分为感兴趣区域和非感兴趣区域:对于感兴趣区域采用霍夫曼编码,对于非感兴趣区域采用低密度奇偶校验码编码;
2)在解码端
a)生成边信息:解码端使用最近的已解码帧,通过采用运动补偿帧内插或外推的方式生成每个非关键帧的边信息,每个非关键帧的边信息被当作原始非关键帧的估计值,估计值的质量越好,低密度奇偶校验码解码端需要改正的“错误”越少,并且向缓冲器所请求的奇偶校验位或位流越少;
b)相关噪声模型:非关键帧和边信息中对应的离散余弦变换系数的残差统计被假定为一个服从拉普拉斯分布的模型,其参数使用离线的训练模式进行初始化估计;
c)低密度奇偶校验码解码:关键帧使用传统的联合图像专家组技术进行解码;非关键帧的感兴趣区域使用霍夫曼进行解码复原;对于非关键帧的非感兴趣区域,一旦知道了边信息离散余弦变换系数和一个给定离散余弦变换系数的残差统计,每个位平面可以进行低密度奇偶校验码解码,从最重要的位平面开始解码;在低密度奇偶校验码解码器的请求下,编码器通过反馈信道发送一些奇偶校验消息,为了判定解码某个特定的位平面是否需要更多的校验位,解码器采用一个请求停止标准,当低密度奇偶校验码正确地解码一个离散余弦变换集的最重要位平面之后,低密度奇偶校验码解码器将以统一的方式处理其余相关的集合,当所有的离散余弦变换集合的位平面都被低密度奇偶校验码正确地解码时,解码器则开始解码下一个集合;
d)重构:在低密度奇偶校验码解码后,所有的位平面及每个离散余弦变换集合被一起分组,以形成解码的量化信号流和集合,一旦可以获得所有的解码量化信号,在相应的边信息系数的辅助下,便可重构所有的离散余弦变换系数,对于所传输的不含非关键帧位流的离散余弦变换系数集合,由边信息对应的离散余弦变换集合来代替;
e)反变换:当所有的离散余弦变换集被重建以后,执行反离散余弦变换,由此便可得到解码的非关键帧;
3)解码图像后处理
对解码后的图像使用滤波器,从而削弱由量化带来的方块效应,去块效应滤波器是一维滤波器,为了得到二维效果,对一个块要进行两次滤波,第一次是在水平方向,第二次在垂直方向,由于块效应产生的原因是量化误差将原来相邻像素值的连续变化变成了“台阶”变化,看起来就有“伪边缘”的方块现象,去块效应就是在尽量使图像总的能量保持不变的条件下,把那些“台阶”很高的阶跃型的灰度变化重新变成“台阶”很小或接近连续的灰度变化;
4)帧混合
对于已经正确解码的各帧,即利用传统的联合图像专家组编解码的关键帧和利用低密度奇偶校验码及霍夫曼混合编解码的非关键帧,根据在编码端所采用的编码图像组的大小,将关键帧和非关键帧按图像组的相应次序混合成视频流,进而恢复成解码后的视频序列,至此,视频编解码压缩处理结束。
所述感兴趣区域采用霍夫曼编码的过程如下:将待编码的灰度级按出现的次数排序,出现次数多的在前面,次数少的在后面;取出现次数最少的两个数的次数相加,之和作为一个新的出现次数的集合元素并重新排序,新出现的次数在新集合中仍遵循降序规则以确定所处的位置,相加的两个次数最少所对应的灰度级成为霍夫曼树的一个叶结点,这两个结点构造一个双亲结点,重复该步骤,直到所有的灰度级都被用来构造霍夫曼树为止;设所有结点的左孩子为“0”,右孩子为“1”,则从根开始,经各中间结点到叶结点的路径代码即是该叶结点的霍夫曼码;对于非感兴趣区域的每个离散余弦变换集合,从最重要的位平面进行低密码奇偶校验码编码;对于每个位平面,所生成的奇偶检验信息被存储在缓冲器中,在解码端的请求下,通过反馈机制,不断地发送校验信息。
对于关键帧,使用传统的联合图像专家组进行编码,利用感兴趣区域区分算法将非关键帧分为感兴趣区域和非感兴趣区域:对于感兴趣区域采用霍夫曼编解码,对于非感兴趣区域采用低密度奇偶校验码进行编解码,具体步骤如下:
步骤1):将每帧分成大小相等且互不重叠的8×8宏块;
步骤2):将关键帧和非关键帧进行梯度变化;
步骤3):计算关键帧和非关键帧相同位置宏块的绝对差值之和;
步骤4):根据感兴趣区域宏块的判定准则,对非关键帧每个宏块进行感兴趣区域区分;
步骤5):对非关键帧的感兴趣区域宏块采用霍夫曼编解码压缩;
步骤6):对非关键帧的其它宏块则采用低密度奇偶校验码编解码压缩。
有益效果:本发明方法提出了一种改进的Wyner-Ziv分布式视频压缩方法,主要是用来解决无线多媒体传感器网络中视频数据量大所带来的网络节点能耗大,网络生存周期短的问题,并满足人们对解码图像质量以及视频实时性的需求。无线多媒体传感器网络通过使用本发明提出的方法,可以解决因大数据量传输带来的网络节点能耗大、网络生存周期短,由运动剧烈带来的运动估计失效及由量化步长带来的方块效应的问题,以及对视频的实时性和主观质量的要求高的问题。达到减少网络传输的数据量,降低节点传输能耗,延长网络生存周期,确保多媒体视频数据传输的实时性和图像的高质量。下面给出具体的说明:
1.编码简单:相对于传统的视频编码标准(如MPEG系列,H.26x),本发明由于采用Wyner-Ziv分布式视频编码方案,编码端简单,解码端复杂。分布式视频编码将运动估计和及运动补偿所带来的编码端的高复杂性、大计算量转移到解码端,而解码端一般位于汇聚节点或网络中心,充分利用汇聚节点和网络中心计算能力强、存储能力大、持续供电的优点,完成对视频的压缩编码。
2.低码率:本发明可以设置图像的GOP的大小,并对WZ帧采用了LDPC和Huffman相结合的编解码方式,向缓冲器所请求的奇偶校验位较少,从而大大降低了编码的码率。
3.能耗低:本发明由于可以改变Key帧之间WZ帧的数量,减少了待处理的视频流的数据量,从而降低了每个传感器节点的编码处理能耗,进而延长了整个网络的生命周期。
4.实时性:本发明由于对视频数据的压缩率高,压缩编码后的数据量小,因此减少了传输的数据量,优化了实时传输,进而保证了视频流传输的实时性。
5.可靠性:本发明由于采用了ROI提取算法,将WZ帧分为ROI区域和非ROI区域,对ROI区域采用Huffman编解码方式,实现了无失真压缩,提高了解码的准确性,此外,对解码后的图像采取去块效应滤波,进一步提高了解码图像的主观质量,进而实现了对视频编码压缩可靠性的要求。
附图说明
图1是分布式视频编码示意图。如图,分布式视频编码框架包括低复杂度编码器和高复杂度解码器。
图2是点对点无线移动视频通信的示意图。如图,发送方采用Wyner-Ziv分布式视频编码并将编码的视频流发送至基站或网络中心节点,在基站或网络中心结点设置码流转换器,将分布式码率转换为H.26x/MPEG码流,然后由基站或网络中心结点将转换后的视频流传送给接收方。对于发送方和接收方终端而言,仅需要进行较低复杂度的编码和解码。
图3是分布式编解码示意图。如图,采用帧内编码和帧间解码相结合的方式,在编码端,采用帧内编码技术相互独立地编码两个或者多个相关的信源,将编码位流发送到接收端;在解码端,利用各个信源间的相关性,进行联合预测解码。
图4是本发明基于梯度域的ROI区分的Wyner-Ziv分布式视频编码示意图。利用ROI区分算法将WZ帧区分为ROI区域和非ROI区域,然后分别采用Huffman和LDPC进行编解码。
图5是解码图像后处理流程图。去块效应滤波仅在图像被解码之后进行滤波。
图6是本发明方法的整个流程图。如图所示,描述了基于梯度域ROI区分的Wyner-Ziv分布式视频编解码的全过程。
具体实施方式
本方法在Wyner-Ziv分布式视频编码方案的基础上,基于图像梯度场域,通过RO判定准则提取运动剧烈区域并基于Huffman编解码压缩,其余区域则基于LDPC分布式编解码,在降低码率的同时提高解码图像质量,降低节点的处理和传输能耗,实现视频的优化传输,延长整个网络的生存周期。对解码后的图像采用去块效应滤波处理,进一步提高了解码图像的质量。
本方法基于Wyner-Ziv分布式视频编码方案,将视频序列分为两种不同的帧:关键帧(Key Frame,K帧)和Wyner-Ziv帧(WZ帧)。对关键帧采用传统的JPEG编码方式,利用ROI区分算法将Wyner-Ziv帧分为ROI区域和非ROI区域,对Wyner-Ziv帧的ROI区域采用Huffman编解码的方式,其余的非ROI区域LPDC的编解码方式。对解码后的图像进行后处理,采用去块效应滤波,进一步提高了解码图像的质量。本方法的实施分为4个阶段:i)在编码端;ii)在解码端;iii)解码图像后处理;iv)帧混合,具体描述如下:
第一阶段:在编码端
该阶段分为以下几个处理过程:
a)帧分离器:视频序列被分为Wyner-Ziv帧(WZ帧)和关键帧(Key帧),其中关键帧周期性的插入,取决于GOP(Group of Pictures)大小。利用帧分离器将视频序列分为不同的帧,对于每个不同的视频序列,由于编码结构的不同,每帧的被赋予的属性不同,因而,采用的编码处理方式也不同。
b)空间变换:基于块的变换,特别地把DCT变换应用到每个WZ帧。依据每个块的DCT系数所处的位置,将整个WZ帧的DCT系数被分为不同的组,从而形成不同的DCT系数集。
c)量化:每个DCT集被统一的量化,这些量化级依赖于所要得到图像的质量。对于一个给定的集合,量化信号的位流被一起分组,形成位平面,然后独立地进行编码。
d)编码:对于Key帧,使用传统的JPEG技术编码,利用ROI区分算法将Wyner-Ziv帧分为ROI区域和非ROI区域:对于ROI区域采用Huffman编码,对于非ROI区域采用LDPC编码。ROI区域采用Huffman编码的过程如下:将待编码的灰度级按出现的次数排序,出现次数多的在前面,次数少的在后面;取出现次数最少的两个数的次数相加,之和作为一个新的出现次数的集合元素并重新排序,新出现的次数在新集合中仍遵循降序规则以确定所处的位置,相加的两个次数最少所对应的灰度级成为Huffman树的一个叶结点,这两个结点构造一个双亲结点,重复该步骤,直到所有的灰度级都被用来构造Huffman树为止;设所有结点的左孩子为“0”,右孩子为“1”,则从根开始,经各中间结点到叶结点的路径代码即是该叶结点的Huffman码。对于非ROI区域的每个DCT集,从最重要的位平面(Most Significant Bit-plane,MSB)开始进行LDPC编码。对于每个位平面(bit-plane),所生成的奇偶检验信息被存储在缓冲器中,在解码端的请求下,通过反馈机制,不断地发送校验信息。
通过这个阶段对视频序列进行了编码的相关处理,为下一阶段的解码作好了准备。第二阶段:在解码端
该阶段分为以下几个处理过程:
a)生成边信息:解码端使用最近的已解码帧,通过执行运动补偿帧内插(或外推)的方式生成每个WZ帧的边信息(Side Information,SI)。每个WZ帧的边信息被当作原始WZ帧的一种估计值。估计值的质量越好,LDPC解码端需要改正的“错误”越少,并且向缓冲器所请求的奇偶校验位(或位流)越少。
b)相关噪声模型:在WZ帧和边信息中对应的DCT系数的残差统计被假定当作一个服从拉普拉斯分布的模型,其参数使用离线(off-line)的训练阶段进行初始化估计。
c)LDPC解码:关键帧使用传统的JPEG技术进行解码;WZ帧的ROI区域使用Huffman进行解码复原;对于WZ帧的非ROI区域,一旦知道了边信息DCT系数和一个给定DCT系数的残差统计,每个位平面可以进行LDPC解码(从MSB解码)。在LDPC解码器的请求下,编码器通过反馈信道发送一些奇偶校验消息。为了判定正确的解码某个特定的位平面是否需要更多的校验位,解码器采用一个请求停止标准。当成功地LDPC解码一个DCT集的MSB位平面之后,LDPC解码器以一个统一的的方式处理其余相关的集。一旦所有的DCT集的位平面被成功地LDPC解码,LDPC解码器开始解码下一个集。
d)重构:在LDPC解码后,所有的位平面及每个DCT集被一起分组,以形成解码的量化信号流和每个集。一旦可以获得所有的解码量化信号,在相应的边信息系数的辅助下,便可重构所有的DCT系数。对于所传输的不含WZ位流的DCT系数集由边信息对应的DCT集来代替。
e)反变换:当所有的DCT集被重建以后,执行IDCT,由此便可得到解码的WZ帧。
通过以上几个处理过程,完成了对Key帧和WZ帧的正确解码。
第三阶段:解码图像后处理
对解码后的图像使用滤波器,从而削弱由量化带来的方块效应。去块效应滤波器是一维滤波器,为了得到二维效果,对一个块要进行两次滤波,第一次是在水平方向,第二次在垂直方向。由于块效应产生的原因是量化误差将原来相邻像素值的连续变化变成了“台阶”变化,看起来就有“伪边缘”的方块现象。去块效应就是在尽量使图像总的能量保持不变的条件下,把那些“台阶”很高的阶跃型的灰度变化重新变成“台阶”很小或接近连续的灰度变化。
第四阶段:帧混合
最后,对于已经正确解码的各帧,即利用传统JPEG编解码Key帧和利用LDPC及Huffman混合编解码的WZ帧,根据在编码端所采用的编码结构GOP的大小,将Key帧和WZ帧按GOP次序混合成视频流,恢复成解码后的视频序列。至此,视频编解码压缩处理结束。
Claims (3)
1.一种面向无线多媒体传感器网络的视频压缩方法,其特征是:采用感兴趣区域ROI区分算法,加强对运动剧烈区域和运动边缘区域的编码,并且对解码后的图像采用去块效应滤波后处理,进一步提高解码图像的主观质量,该方法具体如下:
1)在编码端
a)帧分离器:视频序列被分为关键帧和WZ帧,其中关键帧周期性的插入,取决于图像组的大小,帧分离器将视频序列分为不同的帧,每两个关键帧之间所分配的WZ帧的数目不同,关键帧采用帧内编码,WZ帧采用低密度奇偶校验码编码;
b)空间变换:基于块的变换,把离散余弦变换应用到每个WZ帧上,WZ帧被划分为互不重叠的块,依据每个块的离散余弦变换系数所处的位置,形成不同的离散余弦变换系数集;
c)量化:每个离散余弦变换系数集被统一的量化,量化级依赖于所要得到图像的质量,对于一个给定的集合,量化信号的位流被一起分组,形成位平面,然后独立地进行编码;
d)编码:对于关键帧,使用传统的联合图像专家组进行编码,利用感兴趣区域区分算法将WZ帧分为感兴趣区域和非感兴趣区域:对于感兴趣区域采用霍夫曼编码,对于非感兴趣区域采用低密度奇偶校验码编码;
2)在解码端
a)生成边信息:低密度奇偶校验码解码端使用最近的已解码帧,通过采用运动补偿帧内插或外推的方式生成每个WZ帧的边信息,每个WZ帧的边信息被当作原始WZ帧的估计值,估计值的质量越好,低密度奇偶校验码解码端需要改正的错误越少,并且向缓冲器所请求的奇偶校验位或位流越少;
b)相关噪声模型:WZ帧和边信息中对应的离散余弦变换系数的残差统计被假定为一个服从拉普拉斯分布的模型,其参数使用离线的训练模式进行初始化估计;
c)低密度奇偶校验码解码:关键帧使用传统的联合图像专家组技术进行解码;WZ帧的感兴趣区域使用霍夫曼进行解码复原;对于WZ帧的非感兴趣区域,一旦知道了边信息离散余弦变换系数和一个给定离散余弦变换系数的残差统计,每个位平面可以进行低密度奇偶校验码解码,从最重要的位平面开始解码;在低密度奇偶校验码解码端的请求下,编码端通过反馈信道发送一些奇偶校验消息,为了判定解码某个特定的位平面是否需要更多的校验位,低密度奇偶校验码解码端采用一个请求停止标准,当低密度奇偶校验码正确地解码一个离散余弦变换集的最重要位平面之后,低密度奇偶校验码解码器将以统一的方式处理其余相关的集合,当所有的离散余弦变换集合的位平面都被低密度奇偶校验码正确地解码时,低密度奇偶校验码解码端则开始解码下一个集合;
d)重构:在低密度奇偶校验码解码后,所有的位平面及每个离散余弦变换集合被一起分组,以形成解码的量化信号流和集合,一旦可以获得所有的解码量化信号,在相应的边信息系数的辅助下,便可重构所有的离散余弦变换系数,对于所传输的不含WZ帧位流的离散余弦变换系数集合,由边信息对应的离散余弦变换集合来代替;
e)反变换:当所有的离散余弦变换集被重建以后,执行反离散余弦变换,由此便可得到解码的WZ帧;
3)解码图像后处理
对解码后的图像使用滤波器,从而削弱由量化带来的方块效应,去块效应滤波器是一维滤波器,为了得到二维效果,对一个块要进行两次滤波,第一次是在水平方向,第二次在垂直方向,把台阶很高的阶跃型的灰度变化重新变成台阶很小或接近连续的灰度变化;
4)帧混合
对于已经正确解码的各帧,即利用传统的联合图像专家组编解码的关键帧和利用低密度奇偶校验码及霍夫曼混合编解码的WZ帧,根据在编码端所采用的编码图像组的大小,将关键帧和WZ帧按图像组的相应次序混合成视频流,进而恢复成解码后的视频序列,至此,视频编解码压缩处理结束。
2.根据权利要求1所述的面向无线多媒体传感器网络的视频压缩方法,其特征是所述感兴趣区域采用霍夫曼编码的过程如下:将待编码的灰度级按出现的次数排序,出现次数多的在前面,次数少的在后面;取出现次数最少的两个数的次数相加,之和作为一个新的出现次数的集合元素并重新排序,新出现的次数在新集合中仍遵循降序规则以确定所处的位置,相加的两个次数最少所对应的灰度级成为霍夫曼树的一个叶结点,这两个结点构造一个双亲结点,重复该步骤,直到所有的灰度级都被用来构造霍夫曼树为止;设所有结点的左孩子为“0”,右孩子为“1”,则从根开始,经各中间结点到叶结点的路径代码即是该叶结点的霍夫曼码;对于非感兴趣区域的每个离散余弦变换集合,从最重要的位平面进行低密码奇偶校验码编码;对于每个位平面,所生成的奇偶检验信息被存储在缓冲器中,在解码端的请求下,通过反馈机制,不断地发送校验信息。
3.根据权利要求1所述的面向无线多媒体传感器网络的视频压缩方法,其特征是对于关键帧,使用传统的联合图像专家组进行编码,利用感兴趣区域区分算法将WZ帧分为感兴趣区域和非感兴趣区域:对于感兴趣区域采用霍夫曼编解码,对于非感兴趣区域采用低密度奇偶校验码进行编解码,具体步骤如下:
步骤1):将每帧分成大小相等且互不重叠的8×8宏块;
步骤2):将关键帧和WZ帧进行梯度变化;
步骤3):计算关键帧和WZ帧相同位置宏块的绝对差值之和;
步骤4):根据感兴趣区域宏块的判定准则,对WZ帧每个宏块进行感兴趣区域区分;
步骤5):对WZ帧的感兴趣区域宏块采用霍夫曼编解码压缩;
步骤6):对WZ帧的其它宏块则采用低密度奇偶校验码编解码压缩。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010182470 CN101854548B (zh) | 2010-05-25 | 2010-05-25 | 一种面向无线多媒体传感器网络的视频压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010182470 CN101854548B (zh) | 2010-05-25 | 2010-05-25 | 一种面向无线多媒体传感器网络的视频压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101854548A CN101854548A (zh) | 2010-10-06 |
CN101854548B true CN101854548B (zh) | 2011-09-07 |
Family
ID=42805771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010182470 Expired - Fee Related CN101854548B (zh) | 2010-05-25 | 2010-05-25 | 一种面向无线多媒体传感器网络的视频压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101854548B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107343119A (zh) * | 2017-07-28 | 2017-11-10 | 北京化工大学 | 一种数字图像隐写数据擦除方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012088629A1 (en) * | 2010-12-29 | 2012-07-05 | Technicolor (China) Technology Co., Ltd. | Method for generating motion synthesis data and device for generating motion synthesis data |
PT2700234T (pt) * | 2011-04-22 | 2019-07-23 | Dolby Int Ab | Método e dispositivo para codificação com compressão com perda de dados |
CN102137262B (zh) * | 2011-05-03 | 2017-04-12 | 深圳市云宙多媒体技术有限公司 | 一种不规则划分视频编码模式选择方法、装置 |
CN102158703B (zh) * | 2011-05-04 | 2013-01-23 | 西安电子科技大学 | 基于分布式视频编码自适应相关噪声模型构造系统及方法 |
CN102630008B (zh) * | 2011-09-29 | 2014-07-30 | 北京京东方光电科技有限公司 | 无线视频传输方法及终端 |
CN102510427B (zh) * | 2011-12-01 | 2013-12-18 | 大连三通科技发展有限公司 | 一种低网络带宽手机实时在线传输的方法 |
CN102572428B (zh) * | 2011-12-28 | 2014-05-07 | 南京邮电大学 | 面向多媒体传感网分布式编解码的边信息估计方法 |
CN102595132A (zh) * | 2012-02-17 | 2012-07-18 | 南京邮电大学 | 一种应用于无线传感器网络的分布式视频编解码方法 |
CN103517072B (zh) * | 2012-06-18 | 2017-11-03 | 联想(北京)有限公司 | 视频通信方法和设备 |
CN102833536A (zh) * | 2012-07-24 | 2012-12-19 | 南京邮电大学 | 一种面向无线传感器网络的分布式视频编解码方法 |
JP6217643B2 (ja) * | 2012-09-19 | 2017-10-25 | 日本電気株式会社 | 動画像符号化装置 |
CN103002283A (zh) * | 2012-11-20 | 2013-03-27 | 南京邮电大学 | 多视角分布式视频压缩的边信息生成方法 |
CN104935946B (zh) * | 2015-06-12 | 2017-12-26 | 珠海市杰理科技股份有限公司 | 改善数字图像方块效应的方法和系统 |
WO2017045101A1 (en) | 2015-09-14 | 2017-03-23 | Mediatek Singapore Pte. Ltd. | Advanced deblocking filter in video coding |
CN116634168B (zh) * | 2023-07-26 | 2023-10-24 | 上海方诚光电科技有限公司 | 一种基于工业相机的图像无损处理方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070013561A1 (en) * | 2005-01-20 | 2007-01-18 | Qian Xu | Signal coding |
US8340193B2 (en) * | 2006-08-04 | 2012-12-25 | Microsoft Corporation | Wyner-Ziv and wavelet video coding |
CN100512443C (zh) * | 2007-01-11 | 2009-07-08 | 北京交通大学 | 基于自适应哈什和格型矢量量化的分布式视频编码方法 |
CN101360236B (zh) * | 2008-08-08 | 2010-08-11 | 宁波大学 | 一种Wyner-ziv视频编解码方法 |
CN101621690B (zh) * | 2009-07-24 | 2012-07-04 | 北京交通大学 | 基于Wyner-Ziv理论的两描述视频编码方法 |
-
2010
- 2010-05-25 CN CN 201010182470 patent/CN101854548B/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107343119A (zh) * | 2017-07-28 | 2017-11-10 | 北京化工大学 | 一种数字图像隐写数据擦除方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101854548A (zh) | 2010-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101854548B (zh) | 一种面向无线多媒体传感器网络的视频压缩方法 | |
CN103002283A (zh) | 多视角分布式视频压缩的边信息生成方法 | |
CN101159875B (zh) | 二重预测视频编解码方法和装置 | |
CN102572428B (zh) | 面向多媒体传感网分布式编解码的边信息估计方法 | |
CN102271256B (zh) | 基于模式决策的自适应帧组分布式视频编码和解码方法 | |
CN104320657B (zh) | Hevc无损视频编码的预测模式选择方法及相应的编码方法 | |
CN102256133B (zh) | 一种基于边信息精化的分布式视频编码及解码方法 | |
KR20110014839A (ko) | 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 | |
US9014499B2 (en) | Distributed source coding using prediction modes obtained from side information | |
CN104301730A (zh) | 基于视频移动设备的双向视频编解码系统及其方法 | |
CN103533359A (zh) | 一种h.264码率控制方法 | |
CN103581670A (zh) | H264自适应帧内模式选择码率估计的率失真优化方法及其装置 | |
CN102833536A (zh) | 一种面向无线传感器网络的分布式视频编解码方法 | |
CN100508608C (zh) | 一种无预测循环的抗误码视频编解码方法 | |
CN102595132A (zh) | 一种应用于无线传感器网络的分布式视频编解码方法 | |
CN110351552A (zh) | 视频编码中一种快速编码方法 | |
CN102065293B (zh) | 一种基于空间域预测编码的图像压缩方法 | |
CN105611301A (zh) | 基于小波域残差的分布式视频编解码方法 | |
CN105791868B (zh) | 视频编码的方法和设备 | |
CN101002476B (zh) | 用于编码和解码的方法以及用于视频编码的编码和解码装置 | |
Wang et al. | A low complexity compressed sensing-based codec for consumer depth video sensors | |
Ming-Feng et al. | Lossless video compression using combination of temporal and spatial prediction | |
CN100579227C (zh) | 一种选择帧内预测模式的系统及方法 | |
Barbarien et al. | Scalable motion vector coding | |
CN108632613B (zh) | 基于discover框架的分级分布式视频编码方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110907 Termination date: 20150525 |
|
EXPY | Termination of patent right or utility model |