具体实施方式
以下,参照附图对本发明的实施方式进行说明。
(实施方式1)
图1是本发明实施方式1中,图像编码装置10的功能性结构的一个例子的框图。
图像编码装置10,用于使用参考值扩充输入图像,并对扩充得到的扩充图像进行编码,生成将所述扩充图像的扩充部分的预测误差表示为0的符号,其中,该参考值是为用于按照H.264标准进行帧内预测时周围像素不存在的情况而规定的值;该装置由控制单元11及编码单元12构成。控制单元11由图像扩充参数输出单元111、编码参数输出单元112及图像扩充单元113构成。
作为具体的一个例子,控制单元11及编码单元12,可以是通过计算机执行程序而实现的软件功能,也可以是构成集成电路装置的电路块。另外,输入图像可以是以1080i解像度表示的HDTV图像。
控制单元11中,图像扩充参数输出单元111输出图像扩充参数,该图像扩充参数包含至少表示以下内容中的一个内容的信息:(A)所述扩充部分位于所述输入图像的上方还是下方;(B)所述输入图像是构成运动图像的帧还是半帧(field);以及(C)在所述扩充图像的编码中,编码单元12采用帧内预测还是帧间预测。
该图像扩充参数另外还可以包含以下信息,即,表示输入图像以具有相同数目的亮度像素和色差像素的YUV422方式,还是以具有亮度像素和像素数目为亮度像素一半的色差像素的YUV420方式显示的信息。
该图像扩充参数的内容,例如,根据无图示的用户发来的指示信息确定。
图像扩充单元113根据图像扩充参数,扩充输入图像,生成扩充图像。对该扩充处理的详细内容,在后面叙述。
编码参数输出单元112输出编码参数,该编码参数包含表示编码单元12在所述扩充图像的编码中,采用帧内预测还是帧间预测的信息。编码参数另外还可以包含以下信息,即,规定编码率的压缩率信息、与帧内预测的预测方向相关的模式信息。
编码单元12根据编码参数,对扩充图像进行编码,生成流,该流包含表示图像的符号,同时向图像扩充单元113输出参考像素值。在帧内预测中,该参考像素值是与其他编码块的像素进行比较的像素值,而在帧间预测(表示帧间或者半帧间的预测)中,该参考像素值是与其他帧或者半帧的像素进行比较的像素值。
下面,对图像扩充单元113进行的图像扩充处理进行说明。
图2及图3是直观地示出该图像扩充处理内容的一个例子的图。
图像扩充单元113从图像扩充参数输出单元111接收图像扩充参数,并根据该图像扩充参数的内容,按照规定方向,使用规定行数、规定像素值扩充输入图像。
图2示出的是,对输入图像在上侧扩充8行,获得扩充图像的例子,该例子具体适用于,将1080行的输入图像扩充为1088行的扩充图像时的情况。
当输入图像分别为构成帧的540行的前半帧(Top field)或者后半帧(Bottom field)时,如图2左侧所示,图像扩充单元113在每半帧,对输入图像扩充4行,相当于在每帧扩充8行。当输入图像为1080行的帧时,如图2右侧所示,图像扩充单元113对输入图像扩充8行。
换言之,输入图像为帧时扩充的行数是,输入图像为半帧时扩充的行数的2倍。
另外,当编码单元12在所述扩充图像的编码中采用帧内预测时,图像扩充单元113将参考值128作为图像扩充部分的像素值,该参考值128是为用于按照H.264标准进行帧内预测时周围像素不存在的情况而规定的值。在所述扩充图像的编码中,当编码单元12在所述扩充图像的编码中采用帧间预测时,图像扩充单元113将编码单元12提供的参考像素值作为图像扩充部分的像素值。
图3示出了对输入图像在下侧扩充8行,获得扩充图像的例子。根据输入图像是半帧还是帧的不同,扩充的行数与前述相同。
另外,当编码单元12在所述扩充图像的编码中采用帧内预测时,图像扩充单元113将输入图像的最下方行的像素的像素值作为图像扩充部分的像素值。当编码单元12在所述扩充图像的编码中采用帧间预测时,图像扩充单元113将编码单元12提供的参考像素值作为图像扩充部分的像素值。
到此为止的说明,未对表示亮度信息的亮度像素及表示色差信息的色差像素加以区别。作为一个例子,上述说明均适用于以YUV422方式表示的输入图像的亮度像素和色差像素双方。另外,上述说明适用于以YUV420方式表示的输入图像的亮度像素的同时,上述说明中用一半行数进行的扩充适用于该输入图像的色差像素。
下面,对编码单元12的详细内容进行说明。
图4是编码单元12的功能性结构的一个例子的框图。众所周知,该结构是遵循H.264标准的编码器的一般模型,所以在此非常简单地说明。
编码单元12对图像扩充单元113输出的扩充图像,以每个编码块的宏块为单位进行编码,并编码成为流。编码单元12在帧内预测及帧间预测之中,采用与编码参数输出单元112提供的编码参数对应的预测方式,进行所述编码。
加法单元121计算出扩充图像的像素值与用于预测的参考像素值之间的误差;正交变换单元122将该误差转换为例如离散余弦(cosine)系数;量化单元123对该离散余弦系数进行量化。
逆量化单元124及逆正交变换单元125通过解码所述量化结果,局部求与播放器中计算出的误差同等的误差。加法单元126通过相加该误差和参考像素值,得到局部解码结果的像素值。
加法单元126得到的像素值,输出到帧内预测单元127,与此同时,经过环路滤波器(loop filter)存储到帧存储器129,更进一步,还输出到图像扩充单元113。
当编码中采用帧内预测时,帧内预测单元127根据加法单元126提供的所述像素值,生成规定的参考像素值。根据H.264标准,该参考像素值是为了用于与相邻宏块之间的对比而规定的值。
然后,开关(switch)132选择帧内预测单元127输出的参考像素值;加法单元121计算扩充图像包含的相邻宏块的像素值与所选择的参考像素值之间的误差,由此执行后续的编码。
当编码中采用帧间预测时,运动检测单元130根据对先行的帧或者半帧(即参考图像)计算并存储于帧存储器129的参考像素值,计算出表示后续的帧或者半帧的扩充图像中的宏块的运动矢量。运动补偿单元131将参考图像中以计算出的运动矢量表示的范围的像素值,作为参考像素值输出。
然后,开关132选择运动补偿单元131输出的参考像素值;加法单元121计算后续的帧或者半帧中的宏块的像素值与所选择的参考像素值之间的误差,由此执行后续的编码。
图5是在H.264标准中,为了取得与帧内预测对象的单位块内的各像素之间的差分,而规定使用的参考像素的示意图。如图所示,H.264标准规定,在9种预测模式中,分别取得箭头记号的起点所在的参考像素与该箭头记号方向所在的各像素之间的差分。
此图中,给出了以4×4像素表示该单位块的大小的例子。图中,白色圆表示该单位块内的各像素,斜线填充的圆表示位于该单位块的左方及上方的几个参考像素。
预测模式0中,取得位于单位块的上侧的若干个参考像素与单位块内位于各参考图像的正下方的像素之间的差分。
预测模式1中,取得位于单位块的左侧的若干个参考像素与单位块内位于各参考图像的右侧的像素之间的差分。
预测模式3~8中,取得若干个参考图像与从各参考像素出发的位于箭头记号方向上的单位块内的各像素之间的差分。
位于图像的最上方的单位块,由于上侧的参考像素不存在,所以采用预测模式1、2及8中的任意模式。特别是,位于图像的最左上方的单位块,由于所有的参考像素都不存在,所以假定参考像素的平均值为128并采用预测模式2。该值128是为了用于按照H.264标准进行帧内预测时周围像素不存在的情况而规定的参考值的一个例子。
还有,帧内预测也能以8×8像素及16×16像素大小的单位块为对象进行。
图6是H.264标准中的运动补偿的单位的示意图。现有的MPEG标准中,运动补偿的单位固定为16×16像素大小的宏块,与此相对,H.264标准中,如图6(A)所示,能够利用16×16像素、16×8像素、8×16像素、8×8像素这4种大小的宏块,作为运动补偿的单位,而且,如图6(B)所示,能够利用通过分割8×8像素的宏块得到的8×4像素、4×8像素、4×4像素这3种子宏块。
下面,参照流程图,对图像扩充单元113的处理的主要部分进行说明。
图7是确定扩充行数的处理过程的一个例子的流程图。
当图像扩充参数输出单元111提供的图像扩充参数表示输入图像为帧时(S11中为帧),图像扩充单元113将Ny(用于亮度的扩充行数)确定为8(S12);当图像扩充参数表示输入图像为半帧时(S11中为半帧),图像扩充单元113将Ny确定为4(S13)。
然后,当所述图像扩充参数表示输入图像以YUV420方式显示时(S14中4:2:0),图像扩充单元113将Nc(用于色差的扩充行数)确定为Ny/2(S15);当所述图像扩充参数表示输入图像以YUV422方式显示时(S14中4:2:2),图像扩充单元113将Nc确定为Ny(S16)。
图8是图像扩充处理的一个例子的流程图。
当所述图像扩充参数表示扩充部分的位置在输入图像的上方时(S31中为上),图像扩充单元113对所述输入图像,使用像素值128在所述输入图像的上侧,扩充按照图7所示的流程图确定的行数,生成扩充图像(S32及图2)。另一方面,当所述图像扩充参数表示扩充部分的位置在输入图像的下方时(S31中为下),图像扩充单元113对所述输入图像,使用所述输入图像的最下方行的像素值,在所述输入图像的下侧扩充所确定的行数,生成扩充图像(S33及图3)。
图9是考虑预测中采用帧内预测还是帧间预测的情况下,将图8所示的处理扩展后的流程图。
该扩展的处理中,当图像扩充参数输出单元111提供的图像扩充参数表示预测中采用帧内预测时(S41中为帧内预测),图像扩充单元113执行图8所示的处理。而当图像扩充参数表示预测中采用帧间预测时(S41中为帧间预测),图像扩充单元113使用编码单元12提供的参考像素值,对所述输入图像进行扩充(S42)。此时扩充的方向及行数根据所述图像扩充参数及所述确定的行数得到。
在到此为止说明的结构中,如果使用像素值128,对输入图像在上侧扩充得到扩充图像,并采用帧内预测对该扩充图像进行编码,则对于图像的左上方的宏块,由于使用像素值128进行帧内预测,所以预测误差全部为0。而且,对其他上方的宏块,也由于使用左相邻的像素值进行帧内预测,所以预测误差全部为0。
另外,如果对输入图像,使用所述输入图像的最下方行的像素值,在下侧扩充得到扩充图像,并采用帧内预测对所述扩充图像进行编码,则对于图像下方的宏块,由于使用上相邻的像素值进行预测,所以可以将预测误差变为0。
另一方面,如果使用编码单元12输出的参考像素值(即参考图像的像素值),扩充得到扩充图像,并采用将运动矢量设为0的帧间预测,对所述扩充图像进行编码,也可以将预测误差变为0。在这种情况下,特别希望通过选择例如16×8像素的宏块、8×4像素的子宏块等作为运动补偿的单位,对扩充图像中的扩充部分与其他部分,分别作为各个不同的编码块进行编码。这样,对于扩充部分仅产生与编码条件相关的编码量,可以为抑制生成的编码量作出很大的贡献。
(实施方式2)
图10是本发明实施方式2中,图像编码装置20的功能性结构的一个例子的框图。
图像编码装置20生成作为扩充部分的预测误差的0值,所述扩充部分是为成为扩充图像的一部分而在输入图像扩充的部分,并对所述生成的0值和所述输入图像相关的预测误差,按照H.264标准进行编码,生成将所述扩充部分的预测误差表示为0的符号。图像编码装置20与图像编码装置10相比,图像编码装置20具有省略了图像扩充单元113的控制单元21,同时编码单元22的内容由编码单元12变更得到。
与实施方式1相同,控制单元21及编码单元22,例如可以是通过计算机执行程序而实现的软件功能,也可以是构成集成电路装置的电路块。另外,输入图像可以是以1080i解像度表示的HDTV图像。
以下,对与实施方式1说明的图像编码装置10中的结构要素相同的结构要素,标记相同的符号,并省略说明。
控制单元21向编码单元22输出与实施方式1相同的图像扩充参数及编码参数。
在实施方式2中,该图像扩充参数与实施方式1中不同,仅用于确定所述扩充部分相对于所述输入图像的位置及行数。该图像扩充参数不用于为了向编码单元22输入而对确定的扩充部分生成具体的像素值。
图11是编码单元22的功能性结构的一个例子的框图。与图4所示的编码单元12的结构相比,编码单元22具有0值生成单元221,用于生成作为所述扩充部分的预测误差的0值;编码单元22对所述生成的0值和所述输入图像的预测误差,按照H.264标准进行编码。
图12和图13是直观地示出该编码处理内容的一个例子的图。
图12是扩充部分为输入图像的上侧8行时的例子。
如图所示,图上方的宏块中,上面的8行为扩充的区域。对于将宏块的扩充部分设为虚拟数据(dummy data)(不在意(don’t care)的值)的扩充宏块,进行如下所述的编码。
帧内预测单元127按照H.264标准,分别对图5所示的9种模式生成各个评价值,选择生成的评价值最佳的模式,并以选择的模式进行帧内预测。例如,将用参考图像与宏块之间的对应像素的差分绝对值和表示的预测误差作为评价值,选择该值最小的模式。
特别是,当对扩充宏块进行帧内预测时,将扩充部分A1及A2的预测误差强制地设为0后评价,并确定模式。在帧内预测中,位于图像左上方的块中,只能使用像素值128的平均值预测(预测模式2),位于除此以外的图像上方的块中,只能使用预测模式1、2、8,而对与相邻块中选择的最小编号的预测模式相同的预测模式,可以用1比特表示,若考虑以上因素,则在抑制编码量的方面上,较佳地,例如对所有的扩充宏块选择预测模式2。
运动检测单元130及运动补偿单元131按照H.264标准,在图6所示的每个运动补偿的单位尺寸中生成评价值,选择评价值最佳的运动单位尺寸,并以选择的单位尺寸进行运动补偿。例如,将用参考图像与宏块之间的对应像素的差分绝对值和表现的预测误差设为评价值,选择该值最小的单位尺寸。
特别是,当对扩充宏块进行帧间预测时,将扩充部分B 1及B2的预测误差强制地设为0后评价,选择运动补偿的单位尺寸。
作为一个例子,当选择16×16像素作为单位尺寸时,将上侧块B 1及B2的预测误差设为0后求评价值。该评价值中,仅包括扩充宏块的下侧块B3、B4的预测误差。
作为其他例子,当选择16×8像素作为单位尺寸时,将位于扩充部分的块的预测误差设为0的同时,确定用最少的编码量表示运动矢量。若考虑用运动矢量与由周围运动矢量生成的预测矢量之间的差分表示,则在抑制编码量的方面上,较佳地,可以认为运动矢量与预测矢量相等,并将差分矢量设为0。
然后,加法单元121按照如上所述确定的帧内预测模式、运动补偿的单位尺寸及运动矢量,对输入图像的各块计算出的预测误差,以及0值生成单元221对扩充部分的块A1、A2、B1和B2生成的0值,通过正交变换单元122、量化单元123以及熵编码单元133,编码成为流。
图13是扩充部分为输入图像的下侧8行时的例子。
如图所示,图下方的宏块中,下面的8行为扩充的区域。考虑将宏块的扩充部分设为任意(不在意)的像素值的扩充宏块,进行编码。编码的基本思想,与图12所示的扩充部分在上侧时的情况相同。
帧内预测单元127在对扩充宏块进行帧内预测时,将扩充部分C3及C4的预测误差强制地设为0后评价的同时,选择预测模式。对块C3,从块C1的预测模式以及预测模式2之中,选择编号小的预测模式。这是因为块C3的左侧不存在块,所以采用上述选择方法。对块C4,从块C2的预测模式以及块C3的预测模式之中,选择编号小的预测模式。
另外,运动检测单元130及运动补偿单元131与上侧扩充的情况相对称地,将下侧的块D3及D4的预测误差强制地设为0后进行帧间预测,并选择运动补偿的单位尺寸,同时求运动矢量。
然后,加法单元121按照如上所述确定的帧内预测模式、运动补偿的单位尺寸及运动矢量,对输入图像的各块计算出的预测误差,以及0值生成单元221对扩充部分的块C3、C4、D3和D4生成的0值,通过正交变换单元122、量化单元123以及熵编码单元133,编码成为流。
本发明的图像编码装置及其方法,可以利用于采用帧内预测及帧间预测对图像进行编码的装置,特别有用于按照H.264标准对以1080i解像度表示的HDTV图像进行编码。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。