CN113766237B - 一种编码方法、解码方法、装置、设备及可读存储介质 - Google Patents
一种编码方法、解码方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN113766237B CN113766237B CN202111163092.1A CN202111163092A CN113766237B CN 113766237 B CN113766237 B CN 113766237B CN 202111163092 A CN202111163092 A CN 202111163092A CN 113766237 B CN113766237 B CN 113766237B
- Authority
- CN
- China
- Prior art keywords
- channel
- range
- codebook
- priori
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000003044 adaptive effect Effects 0.000 claims abstract description 147
- 230000015654 memory Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种编码方法、解码方法、装置、设备及可读存储介质,涉及通信技术领域,以提高编码速度和解码速度。该方法包括:获取待编码图像的特征图像;根据所述特征图像,得到码本范围缩放系数;利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;其中,所述目标通道为所述特征图像的任意通道。本申请实施例可以提高编码速度和解码速度。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种编码方法、解码方法、装置、设备及可读存储介质。
背景技术
基于全神经网络的图像压缩技术是近年来的研究趋势。当前,多数深度学习图像压缩方法在熵编码算法上使用整个隐变量的最大值和最小值作为码本的范围,然而隐变量的每个通道中值的分布各不相同,大部分通道中的值较小,使用大的码本范围较大的影响了编解码速度。
发明内容
本申请实施例提供一种编码方法、解码方法、装置、设备及可读存储介质,以提高编码速度和解码速度。
第一方面,本申请实施例提供了一种编码方法,包括:
获取待编码图像的特征图像;
根据所述特征图像,得到码本范围缩放系数;
利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;
根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;
其中,所述目标通道为所述特征图像的任意通道。
第二方面,本申请实施例还提供一种解码方法,包括:
获取编码码流;
根据所述编码码流中的信息,确定解码码本范围;
利用所述解码码本范围,对所述编码码流进行熵解码;
其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围。
第三方面,本申请实施例提供了一种编码装置,包括:
第一获取模块,用于获取待编码图像的特征图像;
第二获取模块,用于根据所述特征图像,得到码本范围缩放系数;
第三获取模块,用于利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;
第一编码模块,用于根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;
其中,所述目标通道为所述特征图像的任意通道。
第四方面,本申请实施例提供了一种解码装置,包括:
第一获取模块,用于获取编码码流;
第一确定模块,用于根据所述编码码流中的信息,确定解码码本范围;
第一解码模块,用于利用所述解码码本范围,对所述编码码流进行熵解码;
其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围。
第五方面,本申请实施例还提供一种电子设备,包括:收发机、存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如上所述的编码方法或者解码方法中的步骤。
第六方面,本申请实施例还提供一种可读存储介质,所述可读存储介质上存储程序,所述程序被处理器执行时实现如上所述的编码方法或者解码方法中的步骤。
在本申请实施例中,在编码端,根据待编码图像的特征图像得到码本范围缩放系数,从而可基于码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围,进行形成编码码流。由于内容自适应先验码本范围是基于每个通道的通道自适应先验码本范围进行缩放得到的,因此,在对每个通道进行编码时,每个通道可以使用与每个通道相适应的码本范围进行编码,从而提高了编码速度。相应的,在解码端,确定解码码本范围,从而可在每个通道的实际字符范围或者通道的内容自适应先验码本范围进行解码,提高了解码速度。
附图说明
图1是本申请实施例提供的编码方法的流程图之一;
图2是本申请实施例提供的解码方法的流程图之二;
图3是本申请实施例提供的编码装置的结构图;
图4是本申请实施例提供的解码装置的结构图。
具体实施方式
本申请实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例中术语“多个”是指两个或两个以上,其它量词与之类似。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,图1是本申请实施例提供的编码方法的流程图,如图1所示,包括以下步骤:
步骤101、获取待编码图像的特征图像。
具体的,在此步骤中,将待编码图像切分成M×N的多个子块,其中,M和N分别表示子块的长和宽,M和N均大于0。然后,将所述子块输入到编码子网络中,得到所述特征图像。在本申请实施例中,M和N可取值为512。通常情况下,在经切分之后,还可能有剩余像素,那么,为了进一步保证编码的准确性和信息的完整性,当所述待编码图像在切分成M×N的多个子块之后具有剩余像素时,将所述剩余像素以0补全,得到补全后的子块,其中,补全后的子块的长和宽均为64的倍数。在这种情况下,将所述M×N的多个子块和补全后的子块输入到编码子网络中,得到所述特征图像。
其中,编码子网络是将多个子块处理生成特征图的网络结构。在一种可能的实现方式中,在将多个块生成特征图时,首先确定卷积参数,然后将卷积参数与编码子网络中的卷积核进行映射关联,生成关联参数的卷积核,最后将多个子块逐一与关联参数的卷积核进行相乘,生成每个子块所对应的特征图(feature map)。
步骤102、根据所述特征图像,得到码本范围缩放系数。
在本申请实施例中,所述码本范围缩放系数用于对每个通道的通道自适应先验码本范围进行缩放,以得到每个通道的内容自适应先验码本范围。
其中,在此可预先获得每个通道的通道自适应先验码本范围,也可在执行本申请实施例时获取每个通道的通道自适应先验码本范围。
具体的,可使用一定大小的训练集(如800张256×256的训练图像)对每个码率的全神经网络模型进行预实验,通过遍历的方式获得模型的每个通道的训练集的字符最大值和最小值,从而形成每个通道的通道自适应先验码本范围。
在此步骤中,可按照如下方式计算码本范围缩放系数:
S1:对于第i次判断,将所述特征图像的每个通道的实际字符范围和自适应先验码本范围的t倍进行比较,并根据比较结果得到第一参数n,其中,n表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围t倍的通道个数,t表示第二参数。
S2:当n大于预设值时,减小第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数;当n小于所述预设值时,增加第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数。其中,预设值可根据实际需要设置,例如设置为20等。
当不满足判断结束条件时,i值累加1,并重复S1至S2,直至满足判断结束条件,并将最后一次判断得到的第二参数作为所述码本范围缩放系数;
其中,i表示当前次判断的序号,i为整数且i的初始值为1;i=1时,t=1;所述判断结束条件包括第i次判断得到的第一参数等于所述预设值,或者,i大于3。
具体的,在所述S2中,当n大于预设值时,按照第一公式计算第i次判断的第二参数;当n小于所述预设值时,按照第二公式计算第i次判断的第二参数;
第一公式:t=t-si;
第二公式:t=t+si;
其中,当i=1时,在第一公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;在第二公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;当2≤i≤3时,在第一公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;在第二公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;其中,s为大于0的常数。
例如,当n大于预设值时,按照第三公式计算第i次判断的第二参数;当n小于所述预设值时,按照第四公式计算第i次判断的第二参数。
第三公式:t=t-0.5i;
第四公式:t=t+0.5i;
其中,其中,当i=1时,在第三公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;在第四公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;当2≤i≤3时,在第三公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;在第四公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数。
在以上的公式中,当s=0.5时,可获得较好的编解码效果,但是,在实际应用中,s还可取其他的数值。
具体的:
当i=1时,初始化t=1。对于特征图像的每个通道,将所述特征图像的每个通道的实际字符范围和通道自适应先验码本范围进行比较,并根据比较结果得到n。
例如,对于第1个通道,将第1个通道的实际字符范围和第1个通道的通道自适应先验码本范围进行比较,判断第1个通道的实际字符范围是否超过第1个通道的通道自适应先验码本范围的t倍。此时,t=1。若第1个通道的实际字符范围超过第1个通道的通道自适应先验码本范围的t倍,则n=1。对于第2个通道,将第2个通道的实际字符范围和第2个通道的通道自适应先验码本范围进行比较,判断第2个通道的实际字符范围是否超过第2个通道的通道自适应先验码本范围的t倍。此时,t=1。若第2个通道的实际字符范围超过第2个通道的通道自适应先验码本范围的t倍,则n值加1,否则n保持不变。以此类推,直到判断完所有的通道,得到最后的n值。当n>20时,按照第一公式计算t,执行后续过程;当n<20时,按照第二公式计算t,执行后续过程;n=20时,则结束循环,此时t=1,n=20。
当i=2时,t的取值为i=1时计算得到的t值。对于第1个通道,将第1个通道的实际字符范围和第1个通道的通道自适应先验码本范围进行比较,判断第1个通道的实际字符范围是否超过第1个通道的通道自适应先验码本范围的t倍。若第1个通道的实际字符范围超过第1个通道的通道自适应先验码本范围的t倍,则n=1。对于第2个通道,将第2个通道的实际字符范围和第2个通道的通道自适应先验码本范围进行比较,判断第2个通道的实际字符范围是否超过第2个通道的通道自适应先验码本范围的t倍。若第2个通道的实际字符范围超过第2个通道的通道自适应先验码本范围的t倍,则n值加1,否则n保持不变。以此类推,直到判断完所有的通道,得到最后的n值。当n>20时,按照第一公式计算t,执行后续过程;当n<20时,按照第二公式计算t,执行后续过程;n=20时,则结束循环,按照上述方式得到t和n=20。
当i=3时,t的取值为i=2时计算得到的t值。对于第1个通道,将第1个通道的实际字符范围和第1个通道的通道自适应先验码本范围进行比较,判断第1个通道的实际字符范围是否超过第1个通道的通道自适应先验码本范围的t倍。若第1个通道的实际字符范围超过第1个通道的通道自适应先验码本范围的t倍,则n=1。对于第2个通道,将第2个通道的实际字符范围和第2个通道的通道自适应先验码本范围进行比较,判断第2个通道的实际字符范围是否超过第2个通道的通道自适应先验码本范围的t倍。若第2个通道的实际字符范围超过第2个通道的通道自适应先验码本范围的t倍,则n值加1,否则n保持不变。以此类推,直到判断完所有的通道,得到最后的n值。当n>20时,按照第一公式计算t,结束过程;当n<20时,按照第二公式计算t,结束过程;n=20时,则结束循环,按照上述方式得到t和n=20。
按照上述过程,得到t和n。最后一次判断得到的t的值可作为码本范围缩放系数,得到n的值可作为后续的第三参数Q的值。
或者,在实际应用中,对于第i次判断,当n大于预设值时,可在第i-1次获得的第二参数或者初始的第二参数的基础上减少某个数值,该数值可根据需要设置。对于第i次判断,当n小于预设值时,可在第i-1次获得的第二参数或者初始的第二参数的基础上增加某个数值,该数值也可根据需要设置。同时,不同次判断对应的增加或者减小的数值可相同,也可不同。例如,第一次判断和第二次判断都需要增加第二参数,那么,第一次判断的增加值和第二次判断的增加值可相同或者不同。
步骤103、利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围。
具体的,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成所述特征图像的每个通道的内容自适应先验码本范围。
步骤104、根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;其中,所述目标通道为所述特征图像的任意通道。
在此步骤中,按通道顺序,可根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围之间的关系,对所述目标通道进行熵编码。具体的:
(1)当所述目标通道的内容自适应先验码本范围为0时,不对所述目标通道进行熵编码。
(2)当所述目标通道的实际字符范围小于或等于所述内容自适应先验码本范围内时,利用所述内容自适应先验码本范围或者所述内容自适应先验码本范围内对所述目标通道进行熵编码。
(3)当所述目标通道的实际字符范围大于所述内容自适应先验码本范围时,利用所述目标通道的实际字符范围对所述目标通道进行熵编码。
在这种情况下,还需向解码端指示目标通道的实际字符范围超出内容自适应先验码本范围的信息,如通道的索引,该通道的实际字符范围的最大值、最小值、最大值和最小值。如果某个通道的最大值和最小值均超出内容自适应先验码本范围,那么,在该信息中需包括两个该通道的索引,一个索引指示最大值,另一个索引指示最小值。
基于以上描述,在本申请实施例中,所述编码码流中包括以下任意一项:
(1)所述码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0。也即,在这种情况下,所有通道的实际字符范围都位于该通道对应的内容自适应先验码本范围内。
(2)所述码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围。
所述第三参数用于表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。第一通道的信息例如可包括第一通道的索引,实际字符范围的最大值和/或最小值等。
在本申请实施例中,在编码端,根据待编码图像的特征图像得到码本范围缩放系数,从而可基于码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围,进行形成编码码流。由于内容自适应先验码本范围是基于每个通道的通道自适应先验码本范围进行缩放得到的,因此,在对每个通道进行编码时,每个通道可以使用与每个通道相适应的码本范围进行编码,从而提高了编码速度。
参见图2,图2是本申请实施例提供的解码方法的流程图,如图2所示,包括以下步骤:
步骤201、获取编码码流。
步骤202、根据所述编码码流中的信息,确定解码码本范围。
步骤203、利用所述解码码本范围,对所述编码码流进行熵解码。
其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围。在实际应用中,可按通道顺序并结合上述信息进行解码。
如前所述,所述编码码流中包括以下任意一项:
(1)码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0;
(2)码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围;
所述第三参数用于表示编码端的特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。所述第一通道的信息例如可包括第一通道的索引,实际字符范围的最大值和/或最小值等。
对于以上两种不同的情况,可有不同的方式确定解码码本范围。
(1)当所述编码码流中包括:码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0时,由于所有通道的实际字符范围都位于该通道对应的内容自适应先验码本范围内,因此,在此可根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成每个通道的内容自适应先验码本范围。
在此情况下,当目标通道的内容自适应先验码本范围为0时,将所述目标通道解码为0;当目标通道的内容自适应先验码本范围不为0时,利用所述目标通道的内容自适应先验码本范围对所述目标通道进行解码;所述目标通道为任意通道。
(2)当所述编码码流中包括:码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q以及指示信息时,需要确定出实际字符范围大于对应的通道自适应先验码本范围T倍的通道即第一通道,以及第二通道(除第一通道之外的第二通道),再针对不同类型的通道确定出对应的解码码本,进而解码。
具体的,包括如下过程:
(1)根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值。
(2)根据所述第一参数和所述指示信息,确定所述第一通道的实际字符范围,并将所述第一通道的实际字符范围作为所述第一通道的解码码本范围。
根据所述第一参数的位置,确定所述指示信息在编码码流中的位置。然后,读取该指示信息获取第一通道的信息,如索引,最大值和/或最小值,并依据索引确定该第一通道。之后,再确定该第一通道的实际字符范围,具体的:
当所述指示信息包括所述第一通道的实际字符范围的最大值时,利用所述第一通道的实际字符范围的最大值和缩放后的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最小值时,利用缩放后的最大值和所述第一通道的实际字符范围的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最大值和最小值时,利用所述第一通道的实际字符范围的最大值和最小值,形成所述第一通道的实际字符范围。
也即,在上述过程中,利用指示信息中指示的最大值和/或最小值,更新前述(1)中获得的缩放后的最大值和/或缩放后的最小值
对于第一通道,利用所述第一通道的实际字符范围,对所述第一通道进行解码。
(3)利用缩放后的最大值和缩放后的最小值,形成第二通道的内容自适应先验码本范围,并将第二通道的内容自适应先验码本范围作为所述第二通道的解码码本范围,所述第二通道为除所述第一通道之外的通道。
其中,前述(1)和(2)之间并无严格的先后顺序关系。如果某个通道的索引没有出现在指示信息中,那么,该通道即可被认为是第二通道。
对于第二通道,利用所述第二通道的内容自适应先验码本范围,对所述第二通道进行解码。
具体的,当所述第二通道的内容自适应先验码本范围为0时,将所述第二通道解码为0;当所述第二通道的内容自适应先验码本范围不为0时,利用所述第二通道的内容自适应先验码本范围对所述第二通道进行解码。
其中,在本申请实施例中,也可预先获得每个通道的通道自适应先验码本范围,也可在执行本申请实施例时获取每个通道的通道自适应先验码本范围。该每个通道的通道自适应先验码本范围与编码端的一致,从而保证编码端和解码端的信息同步。
具体的,可使用一定大小的训练集(如800张256×256的训练图像)对每个码率的全神经网络模型进行预实验,通过遍历的方式获得模型的每个通道的训练集的字符最大值和最小值,从而形成每个通道的通道自适应先验码本范围。
在本申请实施例中,在编码端,根据待编码图像的特征图像得到码本范围缩放系数,从而可基于码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围,进行形成编码码流。由于内容自适应先验码本范围是基于每个通道的通道自适应先验码本范围进行缩放得到的,因此,在对每个通道进行编码时,每个通道可以使用与每个通道相适应的码本范围进行编码,从而提高了编码速度。相应的,在解码端,确定解码码本范围,从而可在每个通道的实际字符范围或者通道的内容自适应先验码本范围进行解码,提高了解码速度。
与其它的全神经网路图像编码熵编解码器如NIC-0.3的熵编解码器相比,利用本申请实施例的方案,可以实现内容、通道双自适应的熵编码,提升了编解码效率,且率失真性能损失在可接受范围内。在引入了新的熵编解码算法后,全神经网络图像编码器的编码、解码速度获得大幅提升,其中编码时间节约了51%(在Kodak测试集上取平均,下同),解码时间节约了47%,且率失真损失仅为0.8%。
本申请实施例还提供了一种编码装置。参见图3,图3是本申请实施例提供的编码装置的结构图。由于编码装置解决问题的原理与本申请实施例中编码方法相似,因此该编码装置的实施可以参见方法的实施,重复之处不再赘述。
如图3所示,编码装置300包括:
第一获取模块301,用于获取待编码图像的特征图像;第二获取模块302,用于根据所述特征图像,得到码本范围缩放系数;第三获取模块303,用于利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;第一编码模块304,用于根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;其中,所述目标通道为所述特征图像的任意通道。
可选的,所述第一获取模块包括:
切分子模块,用于将所述待编码图像切分成M×N的多个子块,其中,M和N分别表示子块的长和宽,M和N均大于0;
处理子模块,用于将所述子块输入到编码子网络中,得到所述特征图像。
可选的,所述第一获取模块还可包括:
补全子模块,用于当所述待编码图像在切分成M×N的多个子块之后具有剩余像素时,将所述剩余像素以0补全,得到补全后的子块,其中,补全后的子块的长和宽均为64的倍数;所述处理子模块,用于将所述M×N的多个子块和补全后的子块输入到编码子网络中,得到所述特征图像。
可选的,所述第二获取模块用于执行如下过程:
S1:对于第i次判断,将所述特征图像的每个通道的实际字符范围和通道自适应先验码本范围的t倍进行比较,并根据比较结果得到第一参数n,其中,n表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围t倍的通道个数,t表示第二参数;
S2:当n大于预设值时,减小第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数;当n小于所述预设值时,增加第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数;
当不满足判断结束条件时,i值累加1,并重复S1至S2,直至满足判断结束条件,并将最后一次判断得到的第二参数作为所述码本范围缩放系数;
其中,i表示当前次判断的序号,i为整数且i的初始值为1;i=1时,t=1;
所述判断结束条件包括第i次判断得到的第一参数等于所述预设值,或者,i大于3。
在所述S2中,当n大于预设值时,按照第一公式计算第i次判断的第二参数;当n小于所述预设值时,按照第二公式计算第i次判断的第二参数;
第一公式:t=t-si;
第二公式:t=t+si;
其中,当i=1时,在第一公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;在第二公式中,在初始的第二参数的基础上得到第1次判断的第二参数;
当2≤i≤3时,在第一公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;在第二公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;
其中,s为大于0的常数。
可选的,所述第三获取模块用于,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成所述特征图像的每个通道的内容自适应先验码本范围。
可选的,所述第一编码模块包括:
第一编码子模块,用于当所述目标通道的内容自适应先验码本范围为0时,不对所述目标通道进行熵编码;
第二编码子模块,用于当所述目标通道的实际字符范围小于或等于所述内容自适应先验码本范围内时,利用所述内容自适应先验码本范围或者所述内容自适应先验码本范围内对所述目标通道进行熵编码;
第三编码子模块,用于当所述目标通道的实际字符范围大于所述内容自适应先验码本范围时,利用所述目标通道的实际字符范围对所述目标通道进行熵编码。
可选的,所述编码码流中包括以下任意一项:
所述码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0;
所述码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围;
所述第三参数用于表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。
可选的,所述装置还可包括:
第四获取模块,用于获取每个通道的通道自适应先验码本范围。
本申请实施例提供的装置,可以执行上述编码方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
本申请实施例还提供了一种解码装置。参见图4,图4是本申请实施例提供的解码装置的结构图。由于解码装置解决问题的原理与本申请实施例中解码方法相似,因此该解码装置的实施可以参见方法的实施,重复之处不再赘述。
如图4所示,解码装置400包括:
第一获取模块401,用于获取编码码流;第一确定模块402,用于根据所述编码码流中的信息,确定解码码本范围;第一解码模块403,用于利用所述解码码本范围,对所述编码码流进行熵解码;其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围。
可选的,所述编码码流中包括以下任意一项:
码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0;
码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围;
所述第三参数用于表示编码端的特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。
可选的,当所述编码码流中包括:码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0时,所述第一确定模块,用于根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成每个通道的内容自适应先验码本范围。
可选的,所述第一解码模块用于:
当目标通道的内容自适应先验码本范围为0时,将所述目标通道解码为0;
当目标通道的内容自适应先验码本范围不为0时,利用所述目标通道的内容自适应先验码本范围对所述目标通道进行解码;
所述目标通道为任意通道。
可选的,当所述编码码流中包括:码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q以及指示信息时,所述第一确定模块包括:
第一获取子模块,用于根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值;
第一确定子模块,用于根据所述第一参数和所述指示信息,确定所述第一通道的实际字符范围,并将所述第一通道的实际字符范围作为所述第一通道的解码码本范围;
第二确定子模块,用于利用缩放后的最大值和缩放后的最小值,形成第二通道的内容自适应先验码本范围,并将第二通道的内容自适应先验码本范围作为所述第二通道的解码码本范围,所述第二通道为除所述第一通道之外的通道。
可选的,所述第一确定子模块用于:
当所述指示信息包括所述第一通道的实际字符范围的最大值时,利用所述第一通道的实际字符范围的最大值和缩放后的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最小值时,利用缩放后的最大值和所述第一通道的实际字符范围的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最大值和最小值时,利用所述第一通道的实际字符范围的最大值和最小值,形成所述第一通道的实际字符范围。
可选的,所述第一解码模块包括:第一解码子模块,用于利用所述第一通道的实际字符范围,对所述第一通道进行解码;第二解码子模块,用于利用所述第二通道的内容自适应先验码本范围,对所述第二通道进行解码。
可选的,所述第二解码子模块用于:
当所述第二通道的内容自适应先验码本范围为0时,将所述第二通道解码为0;
当所述第二通道的内容自适应先验码本范围不为0时,利用所述第二通道的内容自适应先验码本范围对所述第二通道进行解码。
本申请实施例提供的装置,可以执行上述解码方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供一种电子设备,包括:收发机、存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如上所述的编码方法或者解码方法中的步骤。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序,该程序被处理器执行时实现上述编码方法或者解码方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的可读存储介质,可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁盘、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (22)
1.一种编码方法,其特征在于,包括:
获取待编码图像的特征图像;
根据所述特征图像,得到码本范围缩放系数;
利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;
根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;
其中,所述目标通道为所述特征图像的任意通道。
2.根据权利要求1所述的方法,其特征在于,所述获取待编码图像的特征图像,包括:
将所述待编码图像切分成M×N的多个子块,其中,M和N分别表示子块的长和宽,M和N均大于0;
将所述子块输入到编码子网络中,得到所述特征图像。
3.根据权利要求2所述的方法,其特征在于,在将所述子块输入到编码子网络中,得到所述特征图像之前,所述方法还包括:
当所述待编码图像在切分成M×N的多个子块之后具有剩余像素时,将所述剩余像素以0补全,得到补全后的子块,其中,补全后的子块的长和宽均为64的倍数;
所述将所述子块输入到编码子网络中,得到所述特征图像,包括:
将所述M×N的多个子块和补全后的子块输入到编码子网络中,得到所述特征图像。
4.根据权利要求1所述的方法,其特征在于,所述根据所述特征图像,得到码本范围缩放系数,包括:
S1:对于第i次判断,将所述特征图像的每个通道的实际字符范围和通道自适应先验码本范围的t倍进行比较,并根据比较结果得到第一参数n,其中,n表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围t倍的通道个数,t表示第二参数;
S2:当n大于预设值时,减小第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数;当n小于所述预设值时,增加第i-1次获得的第二参数或者初始的第二参数,得到第i次判断输出的第二参数;
当不满足判断结束条件时,i值累加1,并重复S1至S2,直至满足判断结束条件,并将最后一次判断得到的第二参数作为所述码本范围缩放系数;
其中,i表示当前次判断的序号,i为整数且i的初始值为1;i=1时,t=1;
所述判断结束条件包括第i次判断得到的第一参数等于所述预设值,或者,i大于3。
5.根据权利要求4所述的方法,其特征在于,在所述S2中,当n大于预设值时,按照第一公式计算第i次判断的第二参数;当n小于所述预设值时,按照第二公式计算第i次判断的第二参数;
第一公式:t=t-si;
第二公式:t=t+si;
其中,当i=1时,在第一公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;在第二公式中,在初始的第二参数的基础上得到第1次判断输出的第二参数;
当2≤i≤3时,在第一公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;在第二公式中,在第i-1次获得的第二参数的基础上获得第i次判断输出的第二参数;
其中,s为大于0的常数。
6.根据权利要求1所述的方法,其特征在于,所述利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围,包括:
将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成所述特征图像的每个通道的内容自适应先验码本范围。
7.根据权利要求1所述的方法,其特征在于,所述根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,包括:
当所述目标通道的内容自适应先验码本范围为0时,不对所述目标通道进行熵编码;
当所述目标通道的实际字符范围小于或等于所述内容自适应先验码本范围时,利用所述内容自适应先验码本范围对所述目标通道进行熵编码;
当所述目标通道的实际字符范围大于所述内容自适应先验码本范围时,利用所述目标通道的实际字符范围对所述目标通道进行熵编码。
8.根据权利要求1所述的方法,其特征在于,所述编码码流中包括以下任意一项:
所述码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0;
所述码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围;
其中,所述第三参数用于表示所述特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。
9.根据权利要求8所述的方法,其特征在于,所述指示信息包括第一通道的索引,所述第一通道的实际字符范围的最大值和/或最小值。
10.根据权利要求1-9任一项所述的方法,其特征在于,所述方法还包括:
获取每个通道的通道自适应先验码本范围。
11.一种解码方法,其特征在于,包括:
获取编码码流;
根据所述编码码流中的信息,确定解码码本范围;
利用所述解码码本范围,对所述编码码流进行熵解码;
其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围;
其中,所述编码码流是通过如下方式得到的:
根据待编码图像的特征图像,得到码本范围缩放系数;利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;其中,所述目标通道为所述特征图像的任意通道。
12.根据权利要求11所述的方法,其特征在于,所述编码码流中包括以下任意一项:
码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0;
码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q,Q为大于0的整数,以及指示信息,所述指示信息用于指示第一通道的信息,所述第一通道的实际字符范围大于所述第一通道的内容自适应先验码本范围;
所述第三参数用于表示编码端的特征图像中,实际字符范围大于对应的通道自适应先验码本范围T倍的通道个数,T表示所述码本范围缩放参数,T大于或等于1。
13.根据权利要求12所述的方法,其特征在于,当所述编码码流中包括:码本范围缩放系数和所述码本范围缩放系数对应的第三参数Q,Q=0时,所述根据所述编码码流中的信息,确定解码码本范围,包括:
根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值,并利用缩放后的最大值和缩放后的最小值,形成每个通道的内容自适应先验码本范围。
14.根据权利要求13所述的方法,其特征在于,所述利用所述解码码本范围,对所述编码码流进行熵解码,包括:
当目标通道的内容自适应先验码本范围为0时,将所述目标通道解码为0;
当目标通道的内容自适应先验码本范围不为0时,利用所述目标通道的内容自适应先验码本范围对所述目标通道进行解码;
所述目标通道为任意通道。
15.根据权利要求12所述的方法,其特征在于,当所述编码码流中包括:码本范围缩放系数,所述码本范围缩放系数对应的第三参数Q以及指示信息时,所述根据所述编码码流中的信息,确定解码码本范围,包括:
根据所述码本范围缩放系数,将每个通道的通道自适应先验码本范围中的最大值和最小值分别乘以所述码本范围缩放系数,得到缩放后的最大值和缩放后的最小值;
根据第一参数和所述指示信息,确定所述第一通道的实际字符范围,并将所述第一通道的实际字符范围作为所述第一通道的解码码本范围;
利用缩放后的最大值和缩放后的最小值,形成第二通道的内容自适应先验码本范围,并将第二通道的内容自适应先验码本范围作为所述第二通道的解码码本范围,所述第二通道为除所述第一通道之外的通道。
16.根据权利要求15所述的方法,其特征在于,所述根据所述第一参数和所述指示信息,确定所述第一通道的实际字符范围,包括:
当所述指示信息包括所述第一通道的实际字符范围的最大值时,利用所述第一通道的实际字符范围的最大值和缩放后的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最小值时,利用缩放后的最大值和所述第一通道的实际字符范围的最小值,形成所述第一通道的实际字符范围;
当所述指示信息包括所述第一通道的实际字符范围的最大值和最小值时,利用所述第一通道的实际字符范围的最大值和最小值,形成所述第一通道的实际字符范围。
17.根据权利要求15所述的方法,其特征在于,所述利用所述解码码本范围,对所述编码码流进行熵解码,包括:
利用所述第一通道的实际字符范围,对所述第一通道进行解码;
利用所述第二通道的内容自适应先验码本范围,对所述第二通道进行解码。
18.根据权利要求17所述的方法,其特征在于,所述利用所述第二通道的内容自适应先验码本范围,对所述第二通道进行解码,包括:
当所述第二通道的内容自适应先验码本范围为0时,将所述第二通道解码为0;
当所述第二通道的内容自适应先验码本范围不为0时,利用所述第二通道的内容自适应先验码本范围对所述第二通道进行解码。
19.一种编码装置,其特征在于,包括:
第一获取模块,用于获取待编码图像的特征图像;
第二获取模块,用于根据所述特征图像,得到码本范围缩放系数;
第三获取模块,用于利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;
第一编码模块,用于根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;
其中,所述目标通道为所述特征图像的任意通道。
20.一种解码装置,其特征在于,包括:
第一获取模块,用于获取编码码流;
第一确定模块,用于根据所述编码码流中的信息,确定解码码本范围;
第一解码模块,用于利用所述解码码本范围,对所述编码码流进行熵解码;
其中,所述解码码本范围包括通道的实际字符范围或者通道的内容自适应先验码本范围;
其中,所述编码码流是通过如下方式得到的:
根据待编码图像的特征图像,得到码本范围缩放系数;利用所述码本范围缩放系数和每个通道的通道自适应先验码本范围,得到所述特征图像的每个通道的内容自适应先验码本范围;根据所述特征图像的目标通道的实际字符范围和所述目标通道的内容自适应先验码本范围,对所述目标通道进行熵编码,形成编码码流;其中,所述目标通道为所述特征图像的任意通道。
21.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,所述处理器,用于读取存储器中的程序实现如权利要求1至10中任一项所述的编码方法中的步骤;或者实现如权利要求11至18中任一项所述的解码方法中的步骤。
22.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1至10中任一项所述的编码方法中的步骤;或者实现如权利要求11至18中任一项所述的解码方法中的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111163092.1A CN113766237B (zh) | 2021-09-30 | 2021-09-30 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
PCT/CN2022/123194 WO2023051776A1 (zh) | 2021-09-30 | 2022-09-30 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
EP22875157.4A EP4412219A1 (en) | 2021-09-30 | 2022-09-30 | Encoding method and apparatus, decoding method and apparatus, device, and readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111163092.1A CN113766237B (zh) | 2021-09-30 | 2021-09-30 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113766237A CN113766237A (zh) | 2021-12-07 |
CN113766237B true CN113766237B (zh) | 2024-07-02 |
Family
ID=78798608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111163092.1A Active CN113766237B (zh) | 2021-09-30 | 2021-09-30 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4412219A1 (zh) |
CN (1) | CN113766237B (zh) |
WO (1) | WO2023051776A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113766237B (zh) * | 2021-09-30 | 2024-07-02 | 咪咕文化科技有限公司 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021102125A1 (en) * | 2019-11-22 | 2021-05-27 | Tencent America LLC | Method and apparatus for quantization, adaptive block partitioning and codebook coding for neural network model compression |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5136374A (en) * | 1990-04-03 | 1992-08-04 | At&T Bell Laboratories | Geometric vector quantization |
US6701021B1 (en) * | 2000-11-22 | 2004-03-02 | Canadian Space Agency | System and method for encoding/decoding multidimensional data using successive approximation multi-stage vector quantization |
US7657429B2 (en) * | 2003-06-16 | 2010-02-02 | Panasonic Corporation | Coding apparatus and coding method for coding with reference to a codebook |
CN100527843C (zh) * | 2003-12-31 | 2009-08-12 | 中国科学院计算技术研究所 | 解码获取图像的方法 |
US7262719B2 (en) * | 2006-01-30 | 2007-08-28 | International Business Machines Corporation | Fast data stream decoding using apriori information |
CN100583649C (zh) * | 2007-07-23 | 2010-01-20 | 华为技术有限公司 | 矢量编/解码方法、装置及流媒体播放器 |
US20110243437A1 (en) * | 2008-10-24 | 2011-10-06 | Solomon Systech Limited. | System and method for image compression |
CN101742330B (zh) * | 2008-11-24 | 2013-03-27 | 北京中星微电子有限公司 | 一种图像编码方法及装置 |
US7880647B1 (en) * | 2009-07-07 | 2011-02-01 | Silicon Motion Inc. | Huffman decoding method |
CN101668204A (zh) * | 2009-09-25 | 2010-03-10 | 西安电子科技大学 | 免疫克隆图像压缩方法 |
WO2012060171A1 (ja) * | 2010-11-04 | 2012-05-10 | シャープ株式会社 | 動画像符号化装置、動画像復号装置、動画像伝送システム、動画像符号化装置の制御方法、動画像復号装置の制御方法、動画像符号化装置制御プログラム、動画像復号装置制御プログラム、および記録媒体 |
WO2013118476A1 (ja) * | 2012-02-10 | 2013-08-15 | パナソニック株式会社 | 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法 |
CN105761269A (zh) * | 2016-03-14 | 2016-07-13 | 北京大学 | 基于多尺度区分性子空间的图像显著对象的检测方法 |
CN109428602A (zh) * | 2017-08-30 | 2019-03-05 | 前海中科芯片控股(深圳)有限公司 | 一种数据编码方法、装置以及存储介质 |
CN110602494A (zh) * | 2019-08-01 | 2019-12-20 | 杭州皮克皮克科技有限公司 | 基于深度学习的图像编码、解码系统及编码、解码方法 |
US11245903B2 (en) * | 2019-11-22 | 2022-02-08 | Tencent America LLC | Method and apparatus for quantization, adaptive block partitioning and codebook coding for neural network model compression |
EP4088454A4 (en) * | 2020-01-10 | 2024-01-17 | Nokia Technologies Oy | CASCADED PREDICTION TRANSFORMATION METHOD FOR TARGETED MIXED MACHINE-HUMAN VIDEO CODING |
CN111901596B (zh) * | 2020-06-29 | 2021-10-22 | 北京大学 | 基于深度学习的视频混合编码与解码方法及装置、介质 |
CN112887722B (zh) * | 2020-12-09 | 2023-03-14 | 清华大学 | 一种图像无损压缩方法 |
CN113225554B (zh) * | 2021-03-17 | 2022-08-16 | 北京大学 | 一种基于神经网络的图像编解码方法、装置、存储介质及终端 |
CN113382265B (zh) * | 2021-05-19 | 2023-03-24 | 北京大学深圳研究生院 | 视频数据熵编码硬件实现方法、设备、介质及程序产品 |
CN113766237B (zh) * | 2021-09-30 | 2024-07-02 | 咪咕文化科技有限公司 | 一种编码方法、解码方法、装置、设备及可读存储介质 |
-
2021
- 2021-09-30 CN CN202111163092.1A patent/CN113766237B/zh active Active
-
2022
- 2022-09-30 EP EP22875157.4A patent/EP4412219A1/en active Pending
- 2022-09-30 WO PCT/CN2022/123194 patent/WO2023051776A1/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021102125A1 (en) * | 2019-11-22 | 2021-05-27 | Tencent America LLC | Method and apparatus for quantization, adaptive block partitioning and codebook coding for neural network model compression |
Also Published As
Publication number | Publication date |
---|---|
WO2023051776A1 (zh) | 2023-04-06 |
EP4412219A1 (en) | 2024-08-07 |
CN113766237A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107632987B (zh) | 一种对话生成方法及装置 | |
CN113766229B (zh) | 一种编码方法、解码方法、装置、设备及可读存储介质 | |
CN105099463B (zh) | 算术编码设备和算术解码设备 | |
CN112312133B (zh) | 一种视频编码方法、装置、电子设备及可读存储介质 | |
CN113766237B (zh) | 一种编码方法、解码方法、装置、设备及可读存储介质 | |
CN116506073A (zh) | 一种工业计算机平台数据快速传输方法及系统 | |
CN110635807A (zh) | 一种数据编码方法及译码方法 | |
CN117037183A (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
CN111429468B (zh) | 细胞核分割方法、装置、设备及存储介质 | |
CN113256744B (zh) | 一种图像编码、解码方法及系统 | |
CN113365060B (zh) | 一种图像滤波方法、装置、设备及存储介质 | |
CN113192148B (zh) | 基于调色盘的属性预测方法、装置、设备及介质 | |
CN116312502A (zh) | 基于顺序采样分块机制的端到端流式语音识别方法及装置 | |
CN115761837A (zh) | 人脸识别质量检测方法、系统及设备和介质 | |
CN114024551A (zh) | 数据无损压缩方法、系统、电子设备及介质 | |
CN114565693A (zh) | 图像生成和神经网络训练方法、装置、设备及介质 | |
CN113922947A (zh) | 一种基于加权概率模型的自适应对称编码方法以及系统 | |
CN115828848A (zh) | 字体生成模型的训练方法、装置、设备及存储介质 | |
CN112735392A (zh) | 语音处理方法、装置、设备及存储介质 | |
CN112199482A (zh) | 一种对话生成方法、装置、设备及可读存储介质 | |
CN118193858B (zh) | 一种基于图卷积网络的协同过滤推荐方法及装置 | |
JP6526629B2 (ja) | 特に「レンジコーダ」又は算術圧縮による,特に圧縮画像を符号化する方法 | |
KR20200045031A (ko) | 신경망 구조에서 영상 분류 결과의 불확실성 감축을 위한 피드백 구조를 채용한 영상 분류 장치 및 그 방법 | |
KR101517019B1 (ko) | 블록특성을 이용한 적응 이미지 압축방법 및 그 시스템 | |
CN117711416A (zh) | 基于标准化流的音频生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |