CN1231863C - 用于进行图像压缩和解压缩的方法与装置 - Google Patents
用于进行图像压缩和解压缩的方法与装置 Download PDFInfo
- Publication number
- CN1231863C CN1231863C CNB988139057A CN98813905A CN1231863C CN 1231863 C CN1231863 C CN 1231863C CN B988139057 A CNB988139057 A CN B988139057A CN 98813905 A CN98813905 A CN 98813905A CN 1231863 C CN1231863 C CN 1231863C
- Authority
- CN
- China
- Prior art keywords
- interest
- area
- bit
- coefficient
- conversion coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/649—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/127—Prioritisation of hardware or computational resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
- H04N19/645—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
- H04N19/647—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本发明涉及一种用于编码数字图像数据的方法和装置(622),其中一感兴趣区域(606)可以在编码处理开始之前或在该编码过程中被指定,使得编码器输出的优先级(616)被修改,以便对该感兴趣区域做更多的加重,因此增加重建的感兴趣区域的速率和/或保真度。因此,该系统实现经过通信线路的数字图像的更有效的重建。
Description
发明背景:
发明领域:
现代计算机和现代计算机网络实现了在计算机之间和在计算机和存储装置之间的重大信息量的传送。当计算机存取本机存储装置时,例如存取本机硬盘驱动器或本机软驱时,可以很快地接入巨大的信息量。然而,当经过宽域网(WAN)、互联网或无线通信信道(蜂窝电话网络等)从远端的存储单元查找存取数据时,数据传送速率明显要慢。因此传送大文件要花费大量时间。另外,文件的存储要使用宝贵的和有限的存储空间。摄影图像和类似的图形图像通常被认为是大文件,因为一个图像通常需要有与该图像中的每个图像元素或像素有关的信息。因此照片以及类似的图形图像通常需要超过兆字节以上的存储空间,因此需要经过慢速的网络通信发送许多次。因此,最近几年制定了用于压缩摄影图像的很多的协议及标准,以便降低存储该摄影图像所需要的存储空间量,并且降低传送和提交的次数。这种压缩方法实际上创建了该原始图像的数学或统计的近似。
压缩方法可以大致地被分成两个独立的类别:有损压缩方法,其中一定量的图像保真度被损耗;换言之,再生图像的最终检验将表现该图像逼真度的损耗。无损压缩方法,其中该原始图像在解码之后被精确地重建。本发明旨在一种有效率的图像压缩方法和装置,根据最初编码或压缩该图像的用户或系统、或根据通过与编码一侧交互而接收和解码该图像数据的用户或系统的感兴趣区域的选择,其中图像的一部分或几部分能够以比该图像的其它部分更高的重建图像保真度的标准而被压缩。
相关技术的描述
当前用于压缩图像的流行标准被称之为JPEG或″J-peg″标准。该标准是由联合摄影专家组制定,并且被一般用于压缩静止图像,用于存储或网络发送。最近由Said和Pearlman所作的论文讨论了根据分级树形组合分段的新图像编码和解码方法(SPIHT)。见Said和Pearlman的“根据分级树形组合分段的图像编解码器”一文,IEEE学报,用于视频技术的电路和,卷6.3,1996年6月、以及见Said和Pearlman的“图像多清晰度显示”一文,IEEE学报,图像处理,卷5.9,1996年9月。这些论文的内容因此被结合作为参考。这些参考文献公开了计算机软件,当装在一个通用计算机上以及并且运行时,执行一方法并且产生一种装置,其使用整数子波变换提供比特精确度的有损压缩和在同一个嵌入比特数据流中的无损压缩;或产生一种装置,其使用非整数子波变换提供在单一嵌入比特数据流中的比特精度的有损压缩。最初被存储为一个表示多个单独像素的二维阵列的一个图像,根据用于图像逐级传输的一个变换系数,划分比特的优先级。使用子集分段相对于一个给定的阈值,通过确定重要的或不重要的单元而选择最重要的信息。由Said和Pearlman公开的逐级发送方案,首先根据每个变换系数的幅值选择将要发送的最重要的信息;如果该变换是归一的,则幅值越大,则从均方误差(MSE,Dmse())的意义上讲,此系数传送的信息就越多;
其中(i,j)是像素P坐标,因此表示一个像素值。二维阵列c根据c=Q(p)编码,以Q(·)表示用于一个归一的分级子带变换。Said和Pearlman提出假设,根据具有相对小的比特数的一个定点二进制格式表示每个像素坐标和像素值,其实现把该单元作为一个整数处理,用于编码的目的。通过把一个重建矢量
设置到0执行重建图像,并且把该图像计算为:
N是图像像素的数量,因此能够实现上述用于均方差失真的计算。使用数学假设,得知该均方差失真测量以‖ci,j‖2/N减小。该事实使像素值能够根据其二进制表示排列,首先发送最高有效位(MSB),并且由于较大信息内容的原因,还实现具有较大幅值的像素系数被首先发送。该编码器使用一个算法发送针对一具体像素坐标的表示最大像素值的一个值、通过子波变换系数值分类像素坐标,然后输出各系数的最高有效位,使用若干分类传送和改进传送,以便使用发送像素坐标的一小部分提供高质量的重建图像。用户能够通过设置比特的数量在分类传送和细化传送中的付出,而设置一个期望的速率或失真。
发明概述
本发明是用于对发送或存储的图像进行编码的方法和装置,其中一个所使感兴趣的区域(ROI)或该图像的一个确定区域被加重,并且用于在发送之后或从存储器取出之后对该编码图像的解码。该编码方法包括,在数字图像数据中选择所感兴趣的一个区域或几个区域,并且为每个区域指定优先级。执行对整个图像的像素值的子波变换,以便获得该子波的变换系数,以及标识对应于每个感兴趣区域的变换系数。通过按比例增加这些变换系数而加重针对所感兴趣的每个区域的变换系数,该方式是把更多的比特分配到这些变换系数,或改进这些系数的编码排序。在按比例增加用于每一个感兴趣区域的变换系数之后,对于整个图像的变换系数执行量化,以便获得量化指数。在另一个选择中,对应于每个感兴趣区域的量化变换系数的量化指数将根据指定到每个感兴趣区域的优先级按比例增加。在整个图像量化之后,执行针对每一感兴趣区域的按比例增加。根据例如编码排序或比特分配的编码策略,对于该变换系数的量化指数作熵编码,该策略是通过针对每个感兴趣区域的按比例增加而确定的,以便形成一个数据比特数据流。形成一个比特数据流标题,并且把数据比特数据流附加到该比特数据流标题。对该变换系数的量化指数的二进制表示该每一比特字段执行熵编码。使用例如一个二进制算术编码技术的比特平面编码技术、或例如SPIHT编码的一个零-树形编码技术。解码方法包括:从该数据比特数据流分离该比特数据流标题、从该比特数据流标题中解码该比特数据流的描述,例如感兴趣的一个区域或几个区域的坐标、每个区域的优先级、图像的尺寸以及子波分解级别的数量。对应于由感兴趣的一个或几个区域的描述所指定的一个或几个感兴趣的区域的子波变换系数被标识,并且通过随后的解码排序对该数据流熵解码,该解码排序是由对应于每个感兴趣区域的变换系数的标识结果和指定到每个感兴趣区域的优先级确定的。这形成了包括该变换系数的量化指数的一组子带。或是该解量化变换系数、或是对应于每个感兴趣区域变换系数的量化指数被按比例降低。如果在编码器以此排序执行按比例增加和量化,则以此排序执行用于整个图像的变换系数的解量化以及用于每个感兴趣区域的该量化变换系数的按比例降低;如果在编码器以此排序执行量化和按比例增加,则以此排序执行每一感兴趣区域的量化指数的按比例降低以及用于整个图像的量化指数的解量化。以任一情况中,都执行对于量化指数的解量化,以便获得量化变换系数。对于解量化的变换系数执行反相子波变换,以便形成关于整个图像的像素值。本发明中的数字图像不仅可以是二维数字数据,而且可以是一维数字数据,例如话音数据、心电图数据、震波数据。当数据是一维时,基于应用到该二维数据的每一维的子波变换、子带、ROI系数识别或反相子波变换的步骤和装置仅沿着该数据的单一维执行。
依据本发明的一个实施例,提供了一种图像压缩方法,该方法包括以下步骤:提供包括与多个像素的数值和坐标有关的数据的数字图像数据;标识由这些数字图像数据表示的一个图像的至少一个感兴趣区域;根据至少两个优先级类别而对数字图像数据的优先级进行分类和划分,加重对应于至少一个感兴趣区域的数字图像数据,从而使对应于感兴趣区域的数字图像数据所具有的优先级比对应于感兴趣区域之外的区域的数字图像数据更高;并且对数字图像数据进行编码,以根据数字图像数据的优先级形成一个比特数据流。
依据本发明的一个实施例,还提供了另一种图像压缩方法,该方法包括以下步骤:在数字图像数据中执行全部像素值的子波变换以获得变换系数;标识对应于至少一个感兴趣区域的变换系数;通过按比例增加对应于所述感兴趣区域的变换系数,加重对应于该感兴趣区域的变换系数;对包括按比例增加的变换系数的变换系数排序;并对变换系数进行熵编码,以形成一个比特数据流。
依据本发明的一个实施例,还提供了一种用于编码和解码图像的方法,该方法包括以下步骤:以一种计算机可读格式提供数字图像数据,该数据包括与多个像素的数值和坐标有关的数字图像数据;根据至少两个优先级类别对整个图像的数字图像数据进行分类,加重对应于至少一个感兴趣区域的数字图像数据,以使得对应于感兴趣区域的数字图像数据所具有的优先级比对应于感兴趣区域之外的区域的数字图像数据更高;把分类数据发送到一接收机,并且重复地分类和发送,直到在接收机的显示器上出现部分重建图像;根据部分重建图像选择一感兴趣区域;把所选感兴趣区域的数据从接收机发送到发送方以便标识;根据所选感兴趣区域修改数字图像数据的分类,其中对应于感兴趣区域的数字图像数据经过分类和优先级划分,而使其与对应于该感兴趣区域之外区域的数字图像数据相比,具有更高的优先级;以及把修改后的经过分类和优先级划分的数字图像数据发送到接收机,其中感兴趣区域与感兴趣区域之外的区域相比,其对应的数字信息数据的发送具有更高的优先级。
依据本发明的一个实施例,还提供了一种编码表示图像的数字数据的方法,该方法包括以下步骤:以计算机可读格式提供数字图像数据,该数据包括与至少一个图像的数值和坐标有关的数字图像数据;选择由数字图像数据表示的图像的至少一个感兴趣区域;对于数字图像数据执行子波变换以便获得包括变换系数的子带,该子波变换是从包括锤状类型子波变换、宽域类型子波变换、和分组类型子波变换中选择的;标识对应于至少一个所选感兴趣区域的变换系数;对于每个感兴趣区域指定一个优先级;把在每个子带中的变换系数分类而形成至少一个序列;把一个比特速率分配到变换系数的每一序列;通过一个根据被分配的速率选择的量化方案,量化在每一序列中的变换系数;根据针对每一感兴趣区域指定的优先级,按比例增加包括对应于每个感兴趣区域的量化变换系数的比特平面的比特有效级别;根据变换系数的按比例增加的比特有效级别,修改包括量化变换系数的比特平面的一个编码排序;以及根据修改的编码排序,对量化变换系数的比特平面进行熵编码,以便产生数字图像数据的一个编码的比特数据流。
依据本发明的一个实施例,还提供了一种解码表示一个图像的信息的方法,该方法包括以下步骤:接收计算机可读格式的信息,该信息包括表示一个图像的数字数据以及关于在该图像中的至少一个感兴趣区域的数字数据;根据关于至少一个感兴趣区域的信息,在将要以编码比特数据流重建的图像中定位感兴趣区域;标识对应于指定感兴趣区域的数字数据;根据指定到每个感兴趣区域的优先级,修改编码比特数据流的解码排序;根据修改的解码排序,对编码比特流进行熵解码,以便获得对应于具有相同比特有效级别的量化变换系数的比特平面;按比例降低包括对应于每个感兴趣区域的量化变换系数的比特平面的比特有效级别,以便获得量化变换系数的原始的比特有效级别;根据一个解量化方案,解量化该量化变换系数,以便获得变换系数的序列;把变换系数的序列解分类而形成一组子带;以及对于子带执行反相子波变换,以便重建数字图像数据。
依据本发明的一个实施例,还提供了一种用于编码表示一个图像的信息的编码装置,该装置包括:接收装置,用于接收包括与多个像素的数值和坐标有关的数据的信息;子波变换装置,用于对信息执行子波变换以便获得包括系数的子带;标识装置,用于标识对应于感兴趣区域的系数;分类装置,用于根据多个类别对系数进行分类,其中至少一个类别对应于表示该感兴趣区域的系数,并且至少一个类别对应于表示该感兴趣区域之外的区域的系数;熵编码装置,用于根据类别编码该系数,系数被放置到类别中,以获得表示编码系数的若干比特;和发送装置,用于把一比特数据流中的比特发送到远端位置,使得其中的比特被发送的方式取决于该比特对应的系数类别。
依据本发明的一个实施例,还提供了一种用于接收并且解码表示一个图像的信息的解码装置,该装置包括:接收装置,用于接收包括与用于多个像素的数值和坐标有关的数据的信息;熵解码装置,用于根据从接收装置接收到的信息的类别,对该信息进行熵解码;反向量化装置,用于从被熵解码的信息产生子带系数;子带解分类装置,用于根据分类而分解来自反相量化装置的子带系数,以产生子带;反向子波变换装置,用于对子带执行反向子波变换以重建图像。
依据本发明的一个实施例,还提供了一种用于产生表示一个图像的数字图像数据的数字照相机,该数字照相机包括:数字图像数据产生装置,用于产生表示图像的数字图像数据;子波变换装置,用于对该数字图像数据执行子波变换以获得变换系数;标识装置,用于标识对应于感兴趣区域的变换系数;分类装置,用于根据多个类别的变换系数,对该变换系数进行分类,其中至少一个类别对应于表示感兴趣区域的系数,而至少一个类别对应于表示该感兴趣区域之外区域的系数;编码装置,用于编码该变换系数,以编码对应于感兴趣区域的变换系数,其方式使得在该图像中的感兴趣区域比感兴趣区域之外的图像区域被更精确地重建;和存储装置,用于存储被编码的变换系数。
附图的简要描述
为了本发明实施例的清晰理解,将参考附图做描述,其中:
图1示出一个压缩一个图像方法,其中通过把更多的比特分配到感兴趣的区域而对选择的感兴趣区域上的加重;
图2示出解压缩一个图像的方法,该图像利用在一个选择ROI上的加重而被编码;
图3A-3F示出ROI系数定标的一个方法;
图4A和4B示出一个ROI系数定标方法,其中以不同优先级对多个感兴趣区域加重;
图5A-5C示出一个ROI系数定标方法,该方法使用在用于一个ROI的量化指数中的某些比特单元,以便加重该ROI;
图6A-6C示出一个ROI系数定标方法,其中多个感兴趣的区域以不同优先级在不同编码阶段加重;
图7A-7D示出在由该ROI系数定标确定的编码策略之下,基于一个比特平面的编码器的量化指数的熵编码。
图8A-8C示出在每个子带中执行比特平面编码的情况,其中ROI系数定标仅被使用在某些比特有效级别的比特字段上;
图9示出一个识别过程,仅对于感兴趣区域的边界像素以及对于属于定位在感兴趣区域边界之内的一个像素的几个像素执行;
图10A和10B示出由滤波系数是gA(k)的一个低通滤波器和滤波系数是fA(k)的一个高通滤波器以及一个间隔地放弃像素或变换系数的降低取样器实现的子波变换;
图11示出一个编码方法,用于以包括变换系数的一组子带表示该输入图像;
图12示出一个解压缩一个图像的方法,该图像由图11的编码方法编码,具有在一个选择的感兴趣区域上的加重;
图13示出当以逐个块为基础进行编码和解码时的ROI编码;
图14是根据本发明的编码的数据的另一方法的流程图;
图15示出一个方法,从而确定用于编码表示该图像的数字数据比特总数;
图16示出本发明编码装置的一种实施例的方框图;
图17示出本发明解码装置的一种实施例的方框图;以及
图18示出一个实施例,其中该装置包括一个编码该图像的发送侧,并且把该编码的数据发送到接收和显示该图像的接收方。
最佳实施例的详细描述
本发明旨在执行图像压缩的一种方法和装置,其中由用户指定的感兴趣区域被加重,以使其以比图像其余部分更高的逼真度编码。该加重可以出现在该编码过程的开始,或从编码过程的中间开始。如果出现在该编码过程的中间,则该加重可以在进行编码的同时由接收编码比特数据流部分的接收方的使用所驱动。感兴趣区域的加重在变换系数域中实行,以便不引起围绕重建图像上的感兴趣区域的失真边界。在量化之后在变换系数上实行加重的一个实施例中,对应于感兴趣区域的量化指数的信息排序被修改,以使感兴趣的区域能够在逐级重建的较早阶段被重建;因此,以低比特率的更高的逼真度重建感兴趣的区域。由于对感兴趣区域的加重只修改该量化指数的比特字段被编码所使用的排序,所以该加重不引起任何信息损失。而且该信息排序的修改不仅可适用每个系数标准,而且可适用该系数的每个比特字段标准,这不仅改进了图像的特定部分的质量,而且灵便地修改重建每个图像部分所利用的编码排序。本发明的另一实施例是在量化之前加重该变换系数。本实施例不提供象其它模式那样的灵活功能,但是有可能以最小的计算复杂性的增加、在任何比特率以比图像的其它部分更高的逼真度重建感兴趣的区域。
图1示出一个用于压缩图像的方法,通过把更多的比特分配到感兴趣的区域加重在一个图像中选择的感兴趣区域,或在比该感兴趣区域之外的区域更早编码过程的阶段编码该感兴趣的区域而压缩一个图像。编码方法100包括步骤101,执行对于输入数字图像的像素值的子波变换,以便由包括该变换系数的一组子带表示该输入的图像。步骤101后面跟着比特分配步骤102和量化步骤103。在步骤102,每一系数一比特(即系数的显示精确度)被指定到每个子带中的变换系数,以便用数字化值表示该变换系数,该数字化值的确定方式是,具有较大变化或较高变换系数能量的子带的每一系数将被分配一个较大的比特数,这等效于被分配一个较小的量化步长。然而,在用于每一子带或用于全部子带的每一系数的比特被预定的情况中,不执行步骤102。每一系数分配的比特在步骤103中使用。在步骤103,在每个子带中执行对于该变换系数的量化,以便用量化指数表示每个子带的变换系数,其量化指数代表由每一系数的分配比特或由用于每个子带的量化步长指定的精确度。通过步骤103,获得以一个降低的或相同的变换系数的显示精确度表示变换系数的量化指数。获得的量化指数被输入到ROI系数定标步骤107。
在步骤101、102和103的之前、之后或同时,执行感兴趣区域选择步骤104、ROI系数识别步骤105和ROI坐标描述步骤106。在步骤104,在输入的图像上选择感兴趣的区域,并且选择的感兴趣区域的坐标输入到步骤105和106。在步骤105,在每一子带中的对应于选择的感兴趣区域的子波变换系数,即ROI系数被标识,以便通过加重在包括子波变换系数的每一子带中的ROI系数加重在该图像中的所选择的感兴趣的区域。ROI系数(即系数的类别)的识别结果被输入到步骤107,该ROI系数描述该变换系数是否对应于感兴趣的区域或该感兴趣区域的外部区域。在ROI坐标描述步骤106,选择的感兴趣区域的坐标被编码,以便实际发送或存储该ROI坐标信息,从而解码器能够断定在该重建图像中将要加重的感兴趣的区域。在发送步骤109中,该ROI描述信息被加到比特数据流中的标题比特。
在ROI系数定标步骤107,在从103输入的量化指数当中,仅用于对应于感兴趣区域的变换系数的量化指数被加重,其加重方式是使得用于该ROI系数的量化指数通过左位移由指定到感兴趣区域的一个优先级指示值(S)而被按比例增加,以使用于该ROI系数的指数被编码,好像具有比其实际值更大的指数。因此,它们被用一个较大的比特数以一个给定比特率编码,或在如下熵编码步骤108的编码过程的较早编码阶段编码。其中某些量化指数被按比例增加的量化指数连同该系数的类别、在步骤105形成的ROI系数的识别结果以及用于这按比例增加的优先级(左边位移值S)一起输入到步骤108。
在熵编码步骤108,对量化指数的二进制表示的每一比特单元执行熵编码,以便形成一个编码的数据流,在该比特数据流中,其中以量化指数的较高比特有效级别(bit significance level)从该比特字段产生的编码比特,被放置于比以较低比特有效级别由比特字段产生的其它编码比特更早的部分。换言之,对于该量化指数的二进制表示的每个比特字段执行的熵编码的排序是,在最高比特有效级别的比特字段(最高有效位)被首先编码,并且在比特有效级别减少的比特字段按照比特有效级别的降低排序编码。该熵编码步骤能够以任何比特率终止或暂停:当用于编码比特数据流的比特预算被用尽时、当编码比特数据流的接收方或存储方不需要任何进一步比特时、当编码方用户或系统要终止或暂停该步骤时、或当在接收方的用户或系统要终止或暂停该步骤时。
编码器避免对用于ROI系数的量化指数中的最小比特有效级别的底部S的比特字段的编码,因为这些在ROI系数S左位移之前不存在的比特字段不输送任何信息。另外,为了降低计算的成本以便避免编码这些底部S比特字段,一律用0值填充的这些字段可以与量化指数的底部S比特字段一起编码,该底部S比特字段用于感兴趣区域之外的区域,代价是增加编码比特率。用于ROI系数的量化指数的最高S比特字段被专门编码,不编码用于在相同子带中的感兴趣区域之外区域的量化指数的任何比特字段。另外,为了降低计算成本以有选择地编码用于感兴趣区域的最高S比特字段,这些比特字段可以与用于感兴趣区域之外的区域的比特字段一起编码,该比特字段值一律用0填充,代价是增加编码比特率。
步骤108的优选编码技术或者是例如一个二进制算术编码技术的一个比特平面编码,或例如SPIHT编码技术的零树形编码。利用一个比特平面编码技术,在每个子带中的一个确定比特有效级别的全部比特字段被在同一个编码阶段编码。在这些比特字段被编码之后,在另外比特有效级别中的比特字段被编码。在大多数情况下,较高比特有效级别的比特字段被编码比同一个子带中的较低比特有效级别的比特字段的编码要早。在这种情况下,较高比特有效级别的比特字段的编码结果可以被用于编码在较低比特有效级别中的比特字段。利用零树形编码技术,在每一量化指数中的较高比特有效级别的比特字段的编码总是早于在每一量化指数中的较低比特有效级别的比特字段,但是在同一个量化指数中的较低比特重要性标准的某些比特字段的编码早于在其它量化指数中的较高比特重要性标准的比特字段。在步骤108形成的编码数据被发送到发送步骤109,其中数据比特和标题比特被附加到将要发送或存储的到一个比特数据流。
在每一系数分配比特小于该变换系数的显示精确度的一个子带中,每一变换系数由一个量化指数表示,其量化指数的表示精度小于该量化变换系数的值被表示精度。在每一系数的分配比特与该变换系数的值的显示精确度相同的一个子带中,每一变换系数不能被量化,并且每个系数值本身可以被当作将要被给到ROI系数定标步骤107的一个量化指数。本发明适于其中较大变换系数用较大量化指数表示的任何种类的量化方案。本发明最佳的量化是标量量化或一个网格(trellis)编码量化。利用一个标量量化,根据相对于一组门限值的系数幅值,变换系数被量化成指数。利用一个网格编码量化,不仅根据它自己的幅值而且根据量化器的状态,变换系数被量化成指数。
在图3A-3F中,示出ROI系数定标步骤107。对于变换系数的量化指数执行的ROI系数定标或在每一子带中执行、或在整个子带执行、或同时在几个子带组中执行。在每一子带中执行定标的环境中,每一子带可以被指定一个不同优先级,不包括对于针对感兴趣区域的量化指数的优先级(左位移值S)。在仅从某些子带重建的一个图像中感兴趣的选择区域需要加重的情形中,ROI系数定标仅需要在选择的子带中执行(例如当重建该图像的较低空间分辨率形式时,在不需要重建该目标空间分辨率的子带中的系数将不按比例增加)。此后,每一子带中的ROI系数定标被公开,其能够被一般化为一个将被在全部子带或同时在几个子带组中执行一个ROI系数定标,例如通过把相同的优先级值指定到用于在全部子带或几个子带组中的感兴趣区域的量化指数。
为了说明此概念,把一子带(子带[K])中的变换系数表示为Y(j),其中的j(0<=j<J)表示在该子带[K]中的该变换系数和对应于量化指数的一个坐标,Y(j)的量化指数表示为Z(j),在步骤102的每一系数分配比特表示为N,量化指数Z(j)的二进制表示的比特字段是bN-1(j),bN-2(j),...,以及b0(j),(bk(j),0<=k<N,是0或1;bN-1(j)是该Z(j)的最高比特有效级别中的比特字段)。该量化指数Z(j)的二进制表示如下:
Z(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+......+21×b1(j)+20×b0 (j).
(在执行ROI系数定标之前,bn(j)表示在2n比特重要性中的一个比特值)
当被表示为对应于感兴趣区域的变换系数(即ROI系数)时,Y(j)(其中j=js,j=js+1,...和je)、量化指数Z(j)(其中j=js,...,和je)是子带[k]中的ROI系数,其在步骤107中按比例增加。当指定到所选的感兴趣区域的优先级是一个左位移值S时,量化指数Z(js),...,和Z(je)按比例增加到Z(js),...,和Z(je):
Z(js)=2s×Z(js)=2N+S-1×bN-1(js)+......+2S+1×b1(js)+2s×b0(js),
Zs(js+1)=2s×Z(js+1)=2N+S-1×bN-1(js+1)+......+2S+1×b1(js+1)+2s×b0(js+1),
.
.
Zs(je)=2s×Z(je)=2N+S-1×bN-1(je)+......+2S+1×b1(je)+2s×b0(je)
作为通过左位移S定标的结果:a1)对应于指数的幅值已经变成大出2S倍。换句话说,a2)每个比特字段的比特重要性标准(s_level)已经变成大出S倍(s_level=N-1-->s_level=N+S-1-->s_level=N-2-->s_level=N+S-2,...,s_level=0-->s_level=S)。如果每一比特字段按照比特有效级别降低排序编码,则每一按比例增加指数的前S比特字段的编码比在同一子带中的任何其它比特字段都早。换言之,在该按比例增加指数中的较大数量的比特字段将在编码过程的较早阶段编码。a3),在使用比特平面编码的情形中,对包括同一个比特有效级别的比特字段的每个比特平面实行编码。在每一子带中,每一比特平面最好以比特重要性标准的降低排序或任何其它排序编码。覆盖整个子带的每一比特平面的编码排序,可以通过在每一子带中跟随该编码排序而被任意地指定。下面是在同一个子带中每个比特平面的编码排序的一个实例:
第0平面{bN-1(js),bN-1(js+1),...,bN-1(je)}
第1平面{bN-2(js),bN-2(js+1),...,bN-2(je)}
: :
第S-1平面{bN-S(js),bN-S(js+1),...,bN-S(je)}
第S平面{bN-1(O),...,bN-1(js-1),bN-S-1(js),...,bN-S-1(je)bN-1(je+1),...,bN-1(J-1)}
第S+1平面{bN-2(O),...,bN-2( s-1),bN-S-2(js),...,bN-S-2(je),bN-2(je+1),...,bN-2(J-1)}
: :
第N-1平面{bs(O),...,bs(js-1),b0(js),...,b0(je),bs(je+1),...,bs(J-1)}
第N平面{bs-1(O),...,bs-1(js-1),bs-1(je+1),...,bs-1(J-1)}
:
第N+S-1平面{b0(O),...,b0(js-1),b0(je+1),...,b0(J-1)}
实现最大左位移值Smax的确定是通过指定到该子带的每一系数的比特、通过在指定到全部子带的比特中的每一系数的最大比特、通过该子带中的重要比特的最大等级或通过整个子带中的重要比特的最高等级。如果指定比Smax更大的一个左位移值,则其能够被调整到Smax。在此情况中,左位移的值S总是在下面范围内:0<=S<=Smax(Smax=N,0:没有感兴趣的区域的优先级。).即使Smax不是上边界,本发明也以一个小的编码比特率增加或小的计算成本的增加而实现其操作。
如果选择最大左位移或大于该最大左位移的值,则对应于感兴趣区域的量化指数的全部比特字段都将具有不同于同一子带中感兴趣区域之外的区域的量化指数的全部比特字段的比特有效级别。因此,感兴趣区域的全部比特字段和感兴趣区域之外的区域的全部比特字段将被分别地编码。换言之,感兴趣区域的量化指数和感兴趣区域之外的区域的量化指数将被熵编码器分别地编码。
如果左位移值小于该最大值而大于0,则对应于感兴趣区域的量化指数的最高S比特字段的编码将独立于针对同一个子带中感兴趣区域之外的区域的量化指数的任何比特字段的编码,对应于感兴趣区域的量化指数的其它N-S比特字段的编码将与同一个子带中的其它指数的最高N-S比特字段的编码处在同一个编码阶段,而对应于感兴趣区域外部的区域的指数中的其余S比特字段的编码将独立于用于感兴趣区域的任何比特字段的编码。换言之,当左比特位移是小于该最大值而大于0时,感兴趣区域的量化指数和感兴趣区域之外的区域的量化指数将被熵编码器部分独立地编码。
ROI系数定标的最好方法是:e1)按比例增加对应于感兴趣区域的量化指数的值,e2)按比例增加与感兴趣区域相关的比特字段的比特有效级别,e3)再指定编码排序。e1)、e2)和e3分别对应于先前讨论的a1)、a2)和a3)。步骤107的e1)、e2)或e3)的ROI系数按比例增加的任一结果与选定的感兴趣区域的优先级以及对应于感兴趣区域的系数识别结果一起在步骤108使用,以便控制要在步骤108执行的熵编码。
图4A和4B示出一个ROI系数定标方法,其中示出以不同优先级加重多个感兴趣区域。当每一选择区域以同一个加重标准加重时,对应于每个感兴趣区域的量化指数以相同的左位移值按比例增加。在此情况中,对于与任何感兴趣区域对应的量化指数用同一个方法,如图3A-3F示出,执行相同的ROI系数定标。当每一选择区域以其各自的优先级加重时,图3A-3F中示出的按比例增加需要针对每个感兴趣的区域执行。在此情况中,对应于在区域选择器步骤104选择的每个感兴趣区域的变换系数必须被标识,并且在ROI系数识别步骤105中分类成各自的类别。在此分类中,对应于几个感兴趣区域的变换系数被认为是对应于一个感兴趣区域的系数,该感兴趣区域被指定了在全部选择的感兴趣区域中的最高的优先级。根据指定到每个感兴趣区域的类别和优先级,针对每个感兴趣的区域执行ROI系数定标,如图3A-3F所示。
在图5A-5C中,示出从编码的中间开始的ROI系数定标。虽然图3A-3F、4A和4B示出ROI系数定标方法的实施例或是按比例增加该量化指数值、按比例增加量化指数的每个比特字段的比特有效级别、或是再指定量化指数的每个比特字段的编码排序,但是图5A-5C中公开的ROI定标方法的实施例或是按比例增加用于感兴趣区域的量化指数的部分值(该值包括量化指数中的某些比特字段)、按比例增加量化指数中的比特字段的某些比特有效级别、或是再指定该量化指数的某些比特字段的编码排序。换句话说,虽然图3A-3F、4A和4B的ROI系数定标方法使用了在用于感兴趣区域的该变换系数的量化指数中的全部比特字段,以便加重感兴趣的区域,但是图5A-5C的ROI系数定标方法使用在用于感兴趣区域的量化指数中的某些比特字段,以便加重该感兴趣的区域。除其使用比特有效级别或在编码阶段使用ROI系数定标之外,此后公开的ROI系数定标使用的方法与图3A-3F、4A和4B中的ROI系数定标方法相同。
在图5A-5C的ROI系数定标方法中,用于变换系数的全部量化指数的某些比特字段不被按比例增加。这些比特字段可以是某些最高比特字段、某些底部比特字段或某些中间比特字段。在此情况中,从未使用ROI系数定标的比特字段产生的编码比特数据流,可以用不涉及感兴趣区域的一个解码方法解码。如果在编码过程期间并且在编码器从该接收机接收反馈信号期间,编码比特数据流被发送到接收方,当在每个子带中的某些最高比特字段被编码而不使用该ROI定标时,感兴趣区域的选择和其优先级的选择能够由接收方指定:接收方的用户在由来自该编码器的输入编码比特数据流而部分重建的图像上,指定感兴趣的区域和优先级,并且把感兴趣区域的坐标信息以及优先级反馈到编码器;然后,编码器在编码过程中间开始ROI定标。为了解释图5A-5C的主题内容,我们使用与图3A-3F中公开该ROI系数定标使用的相同术语。在一个子带(子带[K])中的变换系数:Y(j),其中j(0<=j<J)表示在子带[K]中变换系数的一个坐标;Y(j)的量化指数:Z(j);在步骤102分配的每一系数比特表示为N。量化指数Z(j)的二进制表示的比特字段是bN-1(j)、bN-2(j),...,和b0(j),(bk(j)其中O<=k<N-1是0或1;左位移定标值由S表示;其中未使用系数定标的比特有效级别的数量由P表示)。在最高P比特位面不使用ROI系数定标而被编码的情形中,Z(j)的二进制表示描述如下:
Z(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+......+21×b1(j)+20×b0(j).
Z(j)被表示为Z1(j)和Z2(j)的组合:Z1(j)是Z(j)事实上的一个部分;Z2(J)是将要按比例增加的一部分。
Z(j)=Z1(j)+Z2(j)或表示为Z(j)={Z1(j),Z2(j)}
其中
Z1(j)=2N-1×bN-1(j)+2N-2×bN-2(j)+......+2N-P×bN-P(j),
Z2(j)=2N-P-1×bN-P-1(j)+2N-P-2×bN-P-2(j)+......+20×b0(j),
假设变换系数标识对应于步骤105中感兴趣的区域是Y(j),其中j=js,js+1...,和je,以及对应于将要在步骤107在按比例增加的量化指数是Z(j),其中j=js...,和je,
Z2(),量化指数Z(js),...,Z(je)的可调节部分,比例增加为Z2s(js),...,Z2s(je):
Z2s(js)=2s×Z2(js)=2N+S-P-1×bN-P-1(js)+2N+S-P-2×bN-P-2(js)+......+2s×b0(js),
Z2s(js+1)=2s×Z2(js+1)=2N+S-P-1×bN-P-1(js+1)+2N+S-P-2×bN-P-2(js+1)+......+2s×b0(js+1),
:
Z2s(je)=2s×Z2(je)=2N+S-P-1×bN-P-1(je)+2N+S-P-2×bN-P-2(je)+......+2s×b0(je)。
由于从编码中间进行ROI系数定标,Z(js),...,和Z(je)是从Z(js)={Z1(js),Z2(js)},...,和Z(je)={Z1(js),Z2(je)}变换到Zs(js)={Z1(js),Z2s(js)},...,和Zs(je)={Z1(je),Z2s(je)}。在图5A-5C示出的ROI系数定标方法中,Z2(j)而不是Z(j)被以与图3A-3F、4A和4B中的相同的定标方法按比例增加。
该最大左位移定标值Smax是通过指定到该子带的每一系数的比特N以及在每个量化指数中的比特字段数P确定的,该量化指数的编码将不使用ROI系数定标。在此情况中,左位移的值S是在下面范围内:0<=S<=Smax(Smax=N-P,0:没有到感兴趣的区域的优先级。)。
如果选择最大左位移Smax=N-P,对应于感兴趣区域的量化指数的底部N-P比特字段,与对应于同一子带中感兴趣区域之外的区域的量化指数的底部N-P比特字段分离。因此,感兴趣区域的底部N-P比特字段和感兴趣区域之外的区域的N-P比特字段将被分别地编码。
如果左位移值小于该最大值而大于0,则用于感兴趣区域的(P+1)st至(P+S)th最高的比特有效级别的量化指数的S个比特字段,被与用于该感兴趣区域之外的区域的任何比特字段分离开(在此实例中,第一最高比特有效级别:MSB,第N最高比特有效级别:LSB)。对应于感兴趣区域的量化指数该其它N-P-S个比特字段将与用于感兴趣区域之外的区域的N-P-S个比特字段一起以各个比特有效级别编码。其余S个比特字段,在用于感兴趣区域之外的区域的量化指数中的S个底部比特字段,被从用于感兴趣区域的任何比特字段分离。
图6A-6C示出一个ROI系数定标方法,其中多个感兴趣的区域以不同优先级在不同编码阶段加重。这项技术与反复地应用图5A-5C讨论的从编码的中间实施ROI定标方法相等效,以便在编码过程中加重另外感兴趣的区域,其中某些量化指数已经通过图3A-3F、4A-4F、或5A-5C示出的方法从编码过程的开始或在某阶段被按比例增加。该方法使得有可能在编码过程中附加不同的感兴趣区域或扩展已经选择的感兴趣区域的范围,或通过把该区域划分成几个部分并且把不同优先级指定到每一部分而从该编码过程的不同阶段一部分一部分地重建选定的感兴趣区域。而且在此情况中,如果在接收方该编码过程和解码过程交互实行,另外感兴趣区域的选择和其优先级的选择可以由该接收方完成。
图7A-7D中,示出当使用一个基于比特平面的编码器时通过ROI系数定标步骤107的该量化指数的熵编码步骤108。本发明的一个特性是修改一组量化指数,该组量化指数是以各个比特有效级别输入到一个比特平面编码器的量化指数,或通过使用ROI系数定标步骤107的结果,修改每一量化指数中的比特字段的一个编码排序。利用一个比特平面编码器和每个平面的编码排序,ROI系数定标的结果定义将要被编码的每个比特平面。基于每个比特平面的比特有效级别确定编码排序是最简单的方法。针对与每一系数类别对应的每个比特平面而确定分别的编码排序是另一方法。例如,用于包括对应于感兴趣区域的系数的比特平面的编码排序的确定,可以独立于用于包括对应于感兴趣区域之外的区域的系数的比特平面的编码排序。如果各自的编码排序被用于系数的每一类别,则覆盖每个类别的编码排序能够任意地选择,并且用于整个的图像的编码排序能够更灵便地指定。当编码每一比特平面的比特平面编码器不使用其它比特平面的任何编码结果或信息时,每个比特平面的编码排序可以是任意的。使用在本实施例中的比特平面编码器可以是任何二进制熵编码器,例如一个二进制算术编码器。比特平面编码能够在每个子带中定义的每个比特平面上执行,或在子带的每个组中定义的每一比特平面上执行,或者在全部子带中定义的每一比特平面上执行。
图7A-7D示出一种情况,在每个子带中执行比特平面编码,其中ROI系数定标被使用在图3A-3F、4A和4B示出的每个比特字段上。ROI编码从该编码的始端开始。在图7A-7D的熵编码中,用于变换系数的量化指数的具有同一个比特有效级别的每一比特字段被分组在一起并且形成一个比特平面,其中该变换系数具有由步骤107中的ROI系数定标确定的同一个比特有效级别。可选择地,在步骤107中被指定相同编码或信息排序的每一比特字段,被分组成同一个比特平面。当每一系数的比特(即代表该指数的精确度)是N,并且对所选的一个或几个感兴趣的区域的优先级是S(0<=S<=N)时,比特平面的数量变成N+S。由以S最高比特有效级别的比特字段组成的S比特平面与用于感兴趣区域的系数相关。由在相邻N-S比特有效级别中的比特字段组成的相邻的N-S比特平面与用于整个图像的系数相关。由以最低S比特有效级别的比特字段组成的最后的S比特平面与用于感兴趣区域之外的区域的系数相关。每一比特平面由比特平面编码器逐个编码。在编码过程中,在较高比特有效级别中的比特平面的编码比在比较低比特有效级别中的比特平面早。每一比特平面的编码比特数据流被附加到一个编码标记,其标记用于标识该编码比特数据流的产生部分表示的比特有效级别。连同该优先级一起,即连同对于该选择的感兴趣区域的左位移值一起,该标记表示那比特部分是否仅表示感兴趣的区域、整个图像、或感兴趣区域之外的区域。当对于感兴趣区域的优先级是最大值N时,从每个比特平面产生的每个比特部分组成该感兴趣的区域或组成感兴趣区域之外的区域。当该优先级是最大值时,用于感兴趣区域的比特平面和那些其它区域的比特平面被分别编码。而且,在感兴趣的区域和其余区域之间的编码排序,和编码比特数据流的比特部分的排序可以是任意的。
通过计数在每个比特平面的编码中付出的比特数,并且通过在用于该感兴趣区域、感兴趣区域之外的区域的比特数或用于这两个区域的比特数超过预算时终止该编码过程,分配到感兴趣区域和感兴趣区域之外的区域的比特数量被更精确地控制。如果对该感兴趣区域的优先级是最大值时,用于感兴趣区域以及用于其它区域的分配的比特数量可以被分别控制。
当对于仅包括对应于感兴趣区域的比特字段的一个比特平面或仅包括对应于感兴趣区域之外的区域的比特字段的一个比特平面进行编码时,通过使用针对一维信号的组织模型,把每个比特平面中的比特字段或被安排成一个将要被熵编码的一维信号,或者通过使用针对二维信号的组织模型,把每个比特平面中的比特字段保持为一个将要被编码的二维信号。当每个比特字段被作为二维信号编码时,在感兴趣区域之外的区域坐标上的比特字段或在感兴趣区域之内的坐标上的比特字段在某些比特有效级别中的比特平面中不存在。为了不增加编码比特率,这些坐标在编码过程中被跳过。可选择地,为了降低跳过这种坐标的计算复杂性,编码不被跳过的这些坐标,但它们被编码的方式好像它们具有0值的比特字段。在解码过程过程中丢弃这些0值。代替0,1也能被使用作为该假定值。
可以在熵编码步骤过程中修改感兴趣区域的优先级。一个实例是在熵编码步骤过程中降低感兴趣区域的优先级:如果用于感兴趣区域的比特数或比特率达到一预先确定值,则降低优先级,以便不在编码过程的其余部分加重该感兴趣区域。另外,如果在该子波域中的感兴趣区域的估计的MSE或峰值信噪比(PSNR)值达到一预定值,则可以降低优先级值。如果根据来自解码方的反馈控制优先级,则不仅该估计MSE或PSNR,而且根据部分重建图像计算出的MSE或PSNR都能被使用。根据比特速度、MSE或PSNR、或与感兴趣区域的压缩压缩性能(例如比特速度与MSE的关系)相关的任何其它测量值的感兴趣区域的优先级控制,使得该编码或解码系统有可能确定最适当的ROI编码策略。而且,在编码或解码方的用户可以决定该策略。该ROI编码策略确定何时以及执行多少该ROI系数定标,确定分配多大的比特率用于将要由熵编码器编码的感兴趣区域以及用于图像的其余部分,确定该感兴趣区域的编码过程何时终止,以及确定用于编码或解码感兴趣区域的任何其它信息。
在图8A-8C中公开了在每个子带中执行比特平面编码的情况,其中仅对于在图5A-5C以及6A-6C示出的某些底部比特有效级别的比特字段使用ROI系数定标(ROI编码从编码的中间开始)。在其中指定到一子带(即代表该指数的精确度)的每一系数的比特是N的情形中,ROI系数定标在量化指数的最高P比特平面之后使用,以及对所选一个或几个感兴趣的区域的优先级是S(0<S<=N-P),在该子带中的比特平面的数量是P+N-P+S=N+S。最高P比特平面包括在每个量化指数中的最高P比特单元。因此,该最高P比特平面表示整个图像。从每一量化指数中的底部N-P比特字段,用图6A-6C中相同的方法形成N-P+S比特平面(在按比例增加步骤107之后,集合在同一个比特有效级别中的比特单元):在N-P+S比特平面当中的最高S比特平面表示所选的一个或几个感兴趣的区域,随后的N-P-S比特平面表示整个图像,并且最后的S比特平面表示感兴趣区域之外区域。其中未使用ROI系数定标的P比特平面不必须是每个子带中的最高P比特平面。它们可以是底部P比特位面或中间P比特平面。当它们是底部P比特位面时,对于在每个量化指数中的最高N-P比特位面执行图3A-7F的ROI系数定标以及图7A-7D中的熵编码。
如图7A-7D那样,用于每个比特平面或用于每个比特平面的一个编码比特部分的一个编码比特数据流被附加到一个标记,并且连接形成一个该子带的编码的比特数据流。而且,通过计数在每个比特面中使用的比特数量,或通过计数在表示整个图像的最高P比特平面中、在表示感兴趣区域的随后最高S比特平面中、在表示整个图像的随后N-P-S比特平面中以及在表示感兴趣区域之外的区域的其余S比特平面中使用的比特数量,能够更精确地控制针对感兴趣区域以及其余区域使用的比特数量。
出现该ROI系数的比特有效级别,可以在该熵编码过程中通过该比特速度、在子波域估算的MSE或PSNR以及对于感兴趣区域的优先级而指定。如果用于编码不使用该ROI系数定标技术的某些比特平面而使用的比特速率达到一确定值,则该定标技术将以较高优先等级从紧邻当前编码的比特平面之后的将要编码的该比特平面开始使用。如果用于编码表示该感兴趣区域的比特平面的比特率付出达到另一确定的值,则对该感兴趣区域的优先级被降低,以便在该编码过程的其余部分不加重该感兴趣区域。不是该比特率,而是在用于整个图像或用于感兴趣区域的子波域中的MSE估算值,可用于确定使用ROI系数定标的比特平面以及确定对感兴趣区域的优先级被降低的比特平面。
在比特分配步骤102,确定被指定到每一子带的每一系数的比特数,以便尽可能以用于整个图像的一个给定比特率降低整个重建图像的失真。每一系数的比特数或在每个子带中的用于每个系数的比特率的确定方式是,具有较多变化或较高能量的变换系数的子带中的每一系数将被分配较大比特数。加到量化步骤103的该比特分配结果,可以是每个子带中的每一系数的比特数、量化步长、或在步骤103选择量化方案的一个参数。当每一系数的比特、量化步长或量化方案在每个子带中预定时,例如当无损编码实现时,将不执行比特分配。
在区域选择器步骤104,由用户在一个显示器上的图像显示上选择一个或几个感兴趣的区域。该显示图像或是一个将要被编码的全空间分辨率图像,或是一个较低清晰度的图像形式。如果该区域选择出现在该图像的较低的清晰度形式上,对应于在要被编码的全清晰度图像中的一个或几个感兴趣的区域的坐标被计算出,用于标识对应于在该全清晰度图像中的感兴趣区域的变换系数。还可以通过一个方法执行区域选择,其中一个自动目标识别系统根据一组判据定义一个或几个感兴趣的区域。该自动目标识别系统可以使用多种方法以便标识感兴趣的区域。例如,模式识别软件可以用于标识图像中感兴趣的目标。
在ROI坐标描述步骤106,描述每个感兴趣区域的坐标被编码,以便作为编码的图像比特数据流的开销信息被有效率地发送或存储。当选择的感兴趣区域是矩形区域时,该矩形的一对角线的两个边缘的坐标将描述该区域。当选择的感兴趣区域是圆形区域时,该圆形的中心坐标以及半径的长度将描述该区域。当选择的一个或几个区域是几个长方形或圆的连接时,该长方形或圆形的每一个以上述讨论的方法描述。如果选择的感兴趣的区域是任意的形状,则该区域的边界由任何形状编码方法所编码,例如链状编码方法或目标编码方法。
在发射机步骤109,在熵编码步骤108产生的编码比特数据流的一些部分可以安排成任何排序。如果该解码的数据将要被发送到一个频繁重建较低清晰度形式的图像显示环境,则与空间分辨率相关的编码比特数据流的若干部分在该整体编码比特数据流的安排比与较高空间分辨率相关的编码比特数据流要早。如果在熵编码步骤产生比特部分的编码排序和该比特部分的发送排序不同,则该比特数据流的若干部分进行的排序将重新排列该比特部分的排序。
在ROI系数识别步骤105,对应于图像域中所选的感兴趣区域的变换系数被标识,或者通过跟踪(tracing)从图像域到变换域的反相子波变换,或者通过跟踪该反相子波变换装置,以便标识通过对于变换系数的执行的滤波和上取样,每一像素值是从哪个变换系数重建的。在此识别过程中,滤波器系数不起任何作用。相反,滤波器长度或滤波器支持区域起作用。滤波器支持越大,对应于图像中的像素变换系数的数量越大。此识别过程通过反相子波变换的每一等级实现。而且,该识别沿着该图像或子带的每一维(垂直方向或水平方向)执行。另外,通过包括滤波和下取样的每一子波变换等级,该识别能够通过跟踪从图像域到变换域的正向子波变换执行。
把图像表示为X(k0),其中0<=k0<K,第一等级分解的低通子带表示为L1(kL1),并且高通子带表示为H1(kH1),其中0<=kL1,kH1<K/2,第二等级分解的低通子带表示为L2(kL2),并且一个高通子带表示为H2(kH2),其中0<=kL2,kH2<K/22.......,第n个等级分解的低通子带表示为LN(KLN),并且一个高通子带表示为HN(kHN),其中0<=kLN,kHN<K/2N。因此,一个锤状类型子波分解或二进制的子波分解的子波变换是:通过1等级反相子波变换从L1和H1重建X;从L2和H2重建L1;...;因此,从H1、H2、...HN、LN重建X;L1、L2...和LN-1是子带,借助该子带执行每一等级的子波变换和反相子波变换。
当k0=k0_R(k0_Rs<=k0_R<=k0_Re)是在所选感兴趣区域中的一个像素时(k0_R:感兴趣区域的像素坐标;k0_Rs和k0_Re:感兴趣区域边界上的像素坐标:k0_R可以是感兴趣区域内一个像素(即k0_R=k0_Rs=k0_Re);在下面解释中,图像和感兴趣的区域被假设是一维信号,因此在感兴趣区域中,k0_Rs是最小坐标而k0_Re是最大坐标),对应于X(k0_R)的变换系数以L1()和H1()标识,使得
-在L1()中的ROI系数:kL1_Rs<=kL1<=kL1Re,
-在H1()中的ROI系数:kH1_Rs<=kH1<=kH1_Re。
然后,假设第一等级分解低通信号L1(kL1)是一个图像而kL1_Rs<=kL1<=kL1_Re是感兴趣区域,变换系数对应于L1(kL1),其中kL1_Rs<=kL1<=kL1_Re在L2()和H2()中被标识。
-在L2()中的ROI系数:kL2_Rs<=kL2>=kL2_Re,
-在H2()中的ROI系数:kH2_Rs<=kH2<=kH2_Re。
重复此过程,直到子带LN和HN,以便完成用于在图像X()中的像素k0_R的ROI系数标识。
如上述所示出,ROI系数标识的执行能够独立地用于在所选感兴趣区域中的每个像素。因此,ROI系数标识与感兴趣区域的形状无关。然而,此标识过程不必针对每个感兴趣的区域中的每个像素执行。相反,该识别过程仅在感兴趣区域的边界像素上以及在图9所示的属于是被定位感兴趣区域边界之内一个像素的像素上执行。由于对应于每个像素的变换系数的数量可能由于上取样(在每个第一等级反相子波变换中执行滤波之前在每个系数之间插入0)或下取样(在每个第一等级子波变换中执行滤波之后间隔地删除系数)的原因而根据像素的位置而变化,所以对应于边界上像素的变换系数可能不在对应于每个子带中该ROI系数组成的区域的边界上。相反,对应于定位在感兴趣区域边界之内一个像素的变换系数,可能在每一子带中的对应于区域的边界上。边界上的像素以及边界之内的一个像素是需要的并且足以标识该变换系数,该变换系数形成每一子带中的对应区域的边界。另外,如果低通滤波器和高通滤波器都具有偶数的滤波器长度,则只有在边界上的像素被用于标识形成每一子带中对应区域边界的系数。
根据用于该边界和该边界内部一像素的标识结果,通过在每一子带中的对应于区域的边界内选择每个系数,标识其余的变换系数。
假设X(k0)(k0_Rs=<k0=<k0_Re)是所选感兴趣区域中的像素(k0_Rs和k0_Re:用于在感兴趣区域的边界上的像素的坐标;即感兴趣区域中的最小坐标;k0_Re:用于在感兴趣区域的其它边界上的一个像素的坐标;在下面解释中,图像和感兴趣的区域被认为是一维信号,因此k0_Rs是感兴趣区域中的最小的坐标,而k0_Re是是感兴趣区域中的最大的坐标)。
对应区域的左边界被标识如下:对应于X(k0_Rs)的变换系数以L1()和H1()标识,使得
-在L1()中的ROI系数:ksL1_Rs<=kL1<=ksLl_Re,
-在H1()中的ROI系数:ksH1_Rs<=kH1<=ksH1-Re.
而且,对应于X(k0_Rs-1)的变换系数被标识,使得
-在L1()中的ROI系数:ksL1_R’s<=kL1<=ksL1_R’e,
-在H1()中的ROI系数:ksH1_R’s<=kH1<=ksH1_R’e.
ksL1_Rs和ksL1_R’s的较小的一个在L()中的对应区域的左边界上,以及ksH1_Rs和ksH1_R’s的较小的一个在H()中的对应区域的左边界上。
对应区域的右边界被标识如下:对应于X(k0_Re)的变换系数以L1()和H1()标识,使得
-在L1()中的ROI系数:keL1_Rs<=kL1<=keL1_Re,
-在H1()中的ROI系数:keH1_Rs<=kH1<=keH1-Re.
而且,对应于X(k0_Re-1)的变换系数被标识,使得
-在L1()中的ROI系数:keL1_R’s<=kL1<=keL1_R’e,
-在H1()中的ROI系数:keH1_R’s<=kH1<=keH1_R’e.
keL1_Re和keL1_R’e的较大的一个在L()中的对应区域的右边界上,以及keH1_Re和keH1_R’e的较大的一个在H()中的对应区域的右边界上。
另外,ROI系数标识在感兴趣区域中的每一像素上执行。通过跟踪在像素上执行的一组子波变换或通过跟踪一组重建该像素值的反相子波变换,对应于感兴趣区域中的每一像素的一组变换系数被标识。对应于在感兴趣区域中的每个像素的每个子带中的已标识的系数组,被分类成一个属于对应感兴趣区域的系数类别的子类别,以使该识别结果可用于按比例增减或重建整体感兴趣区域,以及按比例增减或重建感兴趣区域的任意部分。由于使用在该子波或反相子波变换中的低通滤波器或高通滤波器的重叠,所以某些标识系数属于多个子类别。根据每一标识系数所对应的像素的数量,每个子类别可以被分成子子类别。最终,每个标识系数可以具有一个属性,描述在感兴趣区域之内系数对应哪些像素以及对应多少像素。该属性还可以描述,除了在感兴趣区域之内,在感兴趣区域之外有多少像素对应于该系数。
如图10A和10B示出,由滤波系数是gAA(k)的一个低通滤波器和滤波系数是fA(k)的一个高通滤波器以及一个间隔地放弃像素或变换系数的降低取样器实现的子波变换。一个用于一维信号的单级子波分解,把信号X分解成一个低通子带L和一个高通子带H。通过对信号X执行低通滤波并且下取样该低通滤波器信号而获得低通子带L。通过对信号X执行高通滤波并且下取样该高通滤波器信号而获得高通子带H。
如果该信号是例如一个图像的二维信号,则对于X执行水平或垂直方向的一维信号的单级分解,以便获得L并且H信号。然后以另一方向对于L和H执行一维信号的相同的分解,以便分别获得LL1和LH1,以及HL1和HH1。如果对于LL1执行相同的分解,则获得LL2、LH2、HL2、HH2,并且X被分解成LL2、LH2、HL2、HH2、LH1、HL1和HH1。
通过仅对于LL子带执行单级分解而实现全部分解的一个子带分解,被称之为一个锤型子波分解,或只被称之为子波分解。其中对于每个子带重复同样的单级分解的子带分解被称之为宽域(spacl)子波分解。其中对于每个子带任意地重复一个单级分解的子带分解被称之子波数据包分解。
反相子波变换是通过在每一像素或系数之间插入0的一个上取样器和滤波器系数是gs(k)的低通滤波器以及滤波器系数是fss(k)的高通滤波器实现的。用于一维信号的一个单级子波合成把L和H组合成X。在该单级合成中,L通过2被上取样并且被低通滤波,H通过2被上取样并且低通滤波,然后相加上抽样和滤波的L和H,组成X。在每个分解的子带上执行该单级合成,以便执行任何标准和任何类型的反相子波变换。
图2示出一种解压缩一个图像的方法,其图像是以图1中的所选感兴趣区域上的加重编码的。图2中,解码方法200包括一接收机步骤201,用于接收包括标题比特并且数据比特的一个编码比特数据流。步骤201后面是区域坐标解码步骤202和熵解码步骤204。在步骤202,解码区域坐标的编码数据,以便获得感兴趣区域(ROI)的坐标,该感兴趣区域将在重建图像中加重重建。解码的ROI坐标传给ROI系数标识步骤203,在此步骤标识对应于感兴趣区域的子波变换系数。该ROI系数标识结果在解码步骤204和ROI系数解定标步骤205中使用。
在熵解码步骤204,对于具有在接收机步骤201接收的数据比特的输入比特数据流执行熵解码。针对每一变换系数的量化指数的二进制表示每一比特字段,获得解码比特。在每一量化指数之内,较高比特有效级别的比特字段被解码比较低比特有效级别的比特字段的解码要早。换言之,执行熵解码是为了获得在一个量化指数中以比特重要性的降低排序的每一比特字段。为了知道哪个量化指数作为对应于感兴趣区域的系数被按比例增加、以及知道它们被按比例增加的程度,该熵解码过程在步骤203查询该ROI系数标识结果,并且从接收机步骤201接收的标题比特取出指定到感兴趣区域的优先级值。使用在步骤204中的熵解码器是比特平面解码技术或SPIHT解码技术:如果熵编码是以一个比特平面编码技术实现,则解码必须是以一个相应的比特平面解码技术实现。如果熵编码是以一个SPIHT编码技术实现,则解码必须是以一个SPIHT解码技术实现。熵解码比特被组织成为量化指数的二进制表示的比特字段值,并且被传给ROI系数解定标步骤205作为量化指数。
在步骤205,对应于感兴趣区域的量化指数被按比例降低,以便在步206执行对于量化指数的解量化。由于在编码过程中的量化指数按比例增加,将通过与使用在编码过程中的相同的位移值量而被按比例降低,所以不产生由于按比例降低而引起的信息丢失。哪个量化指数被按比例降低是由在步骤203的ROI系数标识结果给定的,并且该指数被按比例降低的程度是从步骤201接收的标题比特取出的。
在解量化步骤206,对于量化指数执行解量化,以便获得在每个子带中的解量化变换系数。解量化方案由量化步长、每一系数的比特或量化表格指定,其任一个是从标题比特取出的。
在反相子波变换步骤207,对于在每个子带中的解量化变换系数执行一个反相子波变换,以便获得一重建图像。子波分解等级的数量以及子波分解的类型,是由从步骤201的编码的比特数据流取出的标题比特提供。该数量和该类型必须与使用在编码器中的数量和类型相同。
在区域坐标解码步骤202,关于在编码方法100中的ROI坐标描述步骤106形成的感兴趣区域的坐标的编码数据被解码,并且获得ROI坐标。通过以一个逆序执行步骤106ROI的坐标描述,执行该步骤。换句话说,步骤202是以这样的方式执行步骤106,即步骤106的输出是到步骤202的输入,而步骤106的输入是步骤202的输出。在编码比特数据流中多个感兴趣区域被加重的情况下,步骤202解码用于每个感兴趣区域的坐标。
在ROI系数标识步骤203,执行与编码方法100中的步骤105相同的处理。在该解码方重复的相同处理的原因是,指定在编码的比特数据流之内的该所选感兴趣区域的信息,可以被发送或以一个描述的形式保存在被提供作为步骤202的输入的图像域中,比通过步骤203获得的子波域中的一个描述形式更有效。在编码比特数据流中存在多个感兴趣区域的情况下,对应于每一感兴趣区域的ROI系数被标识并且分类到每一类别中。
在熵解码步骤204,编码方法100中的熵编码步骤108产生的编码比特数据流被解码。当在步骤108使用一个比特平面编码器时,相应的比特平面解码器被使用在步骤204。步骤204执行的熵解码是编码方法100中的熵编码步骤108的逆序。解码器能够处理从具有不同优先级的编码的不同阶段开始的多个感兴趣的区域、从编码的始端开始的ROI编码、以及从编码的中间开始的ROI编码。
在步骤204,通过查找用于每个子带的编码标记,该编码的数据比特数据流被分开成用于每个子带的一组比特数据流。然后,通过查找用于每个比特平面的编码标记,用于每一子带的每一比特数据流被分开成用于每个比特平面的一组比特数据流。通过一个比特平面解码器对用于每一比特平面的每一比特数据流熵解码。该比特平面解码被以降低比特有效级别的排序实现的。通过求和用于每个子带的每一系数的比特以及指定到感兴趣区域的优先级(左位移值),给定在每个子带中的比特平面的数量。通过步骤203获得的ROI系数标识结果和比特平面的数量以及对感兴趣区域的优先级,确定每一解码比特被指定到哪个比特字段。
能够在步骤204控制用于每一子带的比特率。最简单的方法是,以期望的比特率或以期望的比特数截断用于每个子带的比特数据流。依靠对感兴趣区域的优先级控制以及指定在编码方的感兴趣区域的加重起动阶段,连同针对每个子带的数据流的截短一起,以一个给定比特率针对感兴趣区域以及图像其余区域的比特分配能够被总体上控制。然而,如果用于表示感兴趣区域的一组比特平面的数据流的比特率是以一个单速率控制器控制(1),用于表示感兴趣区域以及图像的其余区域的一组比特平面的数据流的比特率是以一个单速率控制器控制(2)、以及用于表示感兴趣区域之外的区域的一组比特平面的数据流的比特率是以另一个速率控制器控制(3),则分配到该感兴趣区域以及分配到图像的其它区域的比特率被以用于整个图像的一个给定比特率更精确地控制。如果到感兴趣区域的优先级是最大值,则所有比特平面表示感兴趣的区域或者表示图像的其余区域。因此,提供用于(1)和(3)的速率控制器使得有可能用比特精度控制用于感兴趣区域的比特率以及用于其他图像区域的比特率。
在ROI系数解定标步骤205,对应于感兴趣区域的量化指数的值或对应于感兴趣区域的量化指数的比特有效级别被按比例降低。
除了步骤107的输入是步骤205的输出、步骤107的输出是步骤205的输入、按比例增加步骤107对应于按比例降低步骤205之外,该步骤的细节与编码方法100中的ROI系数定标步骤107的细节完全相同。而且,步骤107的编码排序对应于步骤205的解码排序。
在解量化步骤206,使用的解量化方案恢复由编码方法100中的步骤103使用量化方案所量化的变换系数。如果量化是通过以编码器进行的一个标量量化实现,则解量化必须以一个标量解量化实现。如果量化是通过网格编码的量化实现,则解量化必须以一个网格编码的解量化实现。解量化器的表示级别可以是量化器中的判定级别的中点或可以是该判定级别的矩心,该中点或矩心是通过假设用于每个子带的量化指数值的分配计算的。即使不在编码器执行量化,除了使用整数子波变换以及编码和解码都是无损耗地实现之外,也在该解码器执行解量化。当编码是无损耗实现而解码是以有损耗实现时,量化不在该编码处理中实行,但是在解码过程以执行解量化。
在反相子波变换步骤207,使用一个反相子波变换,重建在编码方法100中步骤101使用的子波变换所分解的图像。
图11示出一方法,通过分配到感兴趣区域的比特比分配到该感兴趣区域之外的区域的比特更多,而对选择的感兴趣区域加重来压缩图像。该编码方法与图1的方法之间的主要差别是,在该方法中对于变换系数执行量化之前,执行ROI系数定标。不同于图1中的步骤是用于ROI系数定标的步骤和用于熵编码的步骤。其余步骤是相同的。
图11中,编码方法1100包括子波变换步骤1101,执行对于输入数字图像的像素值的子波变换,以便由包括该变换系数的一组子带表示该输入的图像。步骤1011之后是分配步骤1102和ROI系数定标步骤1003。在步骤1102,指定到每个子带中的变换系数每一系数的比特(即表示该系数的精确度)被确定。相当于确定用于每一子带的量化步长。在每一系数的分配比特或用于每一子带的量化步长被预定的情况下,不执行步骤1102。在量化级1107使用每一系数分配的比特。根据由步骤1101提供的变换系数执行步骤1102的比特分配的一个可选方案,是根据步骤1103按比例增加的变换系数执行比特分配。
在步骤1101和1102的之前、之后或同时,执行感兴趣区域选择步骤1104、ROI系数识别步骤1105和ROI坐标描述步骤1106。在步骤1104,在输入的图像上选择感兴趣的区域,并且把选择的感兴趣区域的坐标输入到步骤1105和1106。在步骤1105,在每一子带中的对应于选择的感兴趣区域的子波变换系数,即ROI系数被标识,以便通过加重在包括子波变换系数的每一子带中的ROI系数加重在该图像中的所选择的感兴趣的区域。ROI系数(即系数的类别)的识别结果被输入到步骤1103,该ROI系数描述该变换系数是否对应于感兴趣的区域或该感兴趣区域的外部区域。在ROI坐标描述步骤1106,选择的感兴趣区域的坐标被编码,以便有效地发送或存储ROI坐标信息。
在ROI系数定标步骤1103,从步骤1103提供的变换系数中的仅对应于感兴趣区域的变换系数倍乘分配给该选择的感兴趣区域的一个定标值而被加重。根据该定标,对应于感兴趣区域的变换系数在量化步骤1107以较大的比特数量化并且被表示得比其它变换系数更精确。当左位移值被用作一个定标值时,通过左位移该系数值而加重相应的变换系数。在步骤1105形成的ROI系数的识别结果,用于选择哪个系数将要被按比例增加。包括在步骤1103按比例增加的全部变换系数被提供到量化步骤1107,以便被量化。下列步骤与哪个系数被按比例增加无关。如果使用均匀量化器并且该感兴趣区域的定标值是量化步长或整数倍的量化步长,则ROI系数定标可以在量化步骤之后进行。在此情形中,编码方法1100与图1中的编码方法相同。
在步骤1107,执行对于在每个子带中的变换系数的量化,以便用量化指数表示每个子带的变换系数,其量化指数代表由每一系数的分配比特或由用于每个子带的量化步长确定的精确度。通过步骤1107,获得以一个降低的或相同的变换系数值的显示精确度表示变换系数的量化指数。获得的量化指数被传给步骤1108进行熵编码。
在熵编码步骤1108,对量化指数的二进制表示的每一比特单元执行熵编码,以便形成一个编码的数据流,在该比特数据流中,其中由量化指数的较高比特有效级别的比特字段产生的编码比特,与由较低比特有效级别的比特字段产生的其它编码比特相比,被放置于更早的部分。在每一子带中的变换系数的每一比特字段的编码排序由编码技术决定。步骤1108的最佳编码技术或者是例如一个二进制算术编码技术的一个比特平面编码,或例如SPIHT编码技术的零树形编码。
在发射机步骤1109,标题比特,例如图像大小、子波分解级别数、用于每个子带的每一系数的比特或量化步长、ROI描述信息、指定到感兴趣区域的优先级或左位移值,被附加到由熵编码器形成的数据比特。附加数据被作为一个编码比特数据流发送或存储。
当多个感兴趣的区域将要被加重时,在步骤1104标识多个感兴趣的区域,对应于每一感兴趣区域的ROI系数在步骤1105被标识并且分类成不同类别,用于每个感兴趣区域的或用于全部感兴趣区域的坐标在步骤1106编码。用于多个感兴趣区域的步骤1104、1105和1106与用于多个感兴趣区域的编码方法100(图1)的步骤104、105、和106相同。在步骤1103,每个类别中的变换系数的值可以以自己的定标值按比例增加(由指定到每个感兴趣区域的一个定标值倍乘)。结果,每个感兴趣的区域可以用不同的加重编码,并且每个感兴趣区域的图像质量能够被独立地控制。
图12示出一种解压缩一个图像的方法,其图像是以图11中的所选感兴趣区域上的加重编码的。图12中的解码方法和图2中的解码方法之间的重要的差别是,图12中的解码方法的解量化在执行ROI系数解定标之前执行,而图2中的解码方法的解量化在执行ROI系数解定标之后执行。与图2中不同的步骤是对于熵解码的步骤和用于ROI系数解定标的步骤。其余步骤是相同的。
图12中,解码方法1200包括一接收机步骤1201,用于接收包括标题比特和数据比特的编码比特数据流。步骤1201后面是区域坐标解码步骤1202和熵解码步骤1204。在步骤1202,解码区域坐标的编码数据,以便获得感兴趣区域的坐标(ROI),其将在重建图像中以一个加重重建。解码的ROI坐标传给ROI系数标识步骤1203,其中标识对应于感兴趣区域的子波变换系数。该ROI系数标识结果在ROI系数解定标步骤1206中使用。
在熵解码步骤1204,对于具有在接收机步骤1201接收的数据比特的输入比特数据流执行熵解码。针对每一变换系数的量化指数的二进制表示每一比特字段获得解码比特。在每一量化指数中,较高比特有效级别的比特字段被解码,比较低比特有效级别的比特字段的解码要早。使用在步骤1204中的熵解码器使用比特平面解码技术或SPIHT解码技术:如果熵编码是以一个比特平面编码技术实现,则解码必须是以一个相应的比特平面解码技术实现;如果熵编码是以一个SPIHT编码技术实现,则解码必须是以一个SPIHT解码技术实现。熵解码比特被组织成为量化指数的二进制表示的比特字段值,并且被传给解量化步骤1205。
在解量化步骤1205,对于量化指数执行解量化,以便获得在每个子带中变换系数的解量化值。解量化方案由量化步长、每一系数的比特或量化表格确定,其任一个都是从标题比特取出的。
在步骤1206,对应于将要在重建图像上被加重的一个感兴趣区域的变换系数的值被按比例降低。通过用从接收机步骤1201接收的标题比特取出的一个定标值除相应的变换系数,该值执行按比例降低。当通过一个左位移值指定该定标值时,该按比例降低是通过对于该系数值执行的右位移该定标值实现的。
在反相子波变换步骤1207,对于在每个子带中的变换系数执行一个反相子波变换,以便获得一重建图像。子波分解等级以及子波分解的类型是由从步骤1201的编码的比特数据流取出的标题比特提供。该数目和该类型必须与使用在编码器中的数目和类型相同。
当多个感兴趣的区域将要被加重时,根据从接收机步骤1201接收的标题比特,对应于每一感兴趣区域的ROI系数在步骤1203被标识。根据该ROI系数标识结果和由标题比特提供的、指定到每个感兴趣区域的一个优先级或定标值,对应于每一感兴趣区域的变换系数被根据对于每个感兴趣区域的优先级而按比例降低。
图13示出其中以逐个块为基础进行编码和解码的感兴趣的区域。以此编码和解码方案中,一个图像被分成一组块(图像的小部分)其形状是矩形、正方形、条线或长方形、正方形和条线的某些或全部的组合,并且每一块的处理作为到编码器的单独输入或用于解码器的单独的输出。感兴趣区域之外的每一块由图1或图11中的编码方法编码,不使用ROI功能,(不标识ROI系数,不执行按比例增加)。把一个块标识为感兴趣区域之外的一个块的一个编码标记,被加到用于感兴趣区域之外的一个块的编码比特数据流。感兴趣区域的内部的每一块也不使用ROI功能编码,或做为选择,该感兴趣区域内部的块可以使用ROI功能,例如ROI系数定标功能,编码。把一个块标识为感兴趣区域内部一个块的一个编码标记,被加到用于感兴趣区域内部一个块的编码比特数据流。重叠感兴趣区域边界的每一块通过使用ROI功能的图1或图11中的一个编码方法编码。标识感兴趣区域边界的一个编码标记,被加到用于重叠该感兴趣区域边界的一个块的编码比特数据流。用于每一块的比特率的分配方式是,在感兴趣区域之内的块被分配最高的比特率,重叠该感兴趣区域的块被分配次最高的比特率,而感兴趣区域之外的块被分配最低的比特率。做为选择,为了要降低编码方和解码方的计算复杂性,根据在感兴趣区域之内的像素的数量、在该感兴趣区域之内的像素百分数或任何其它判据,重叠感兴趣区域边界的块被视为感兴趣区域内部的块或感兴趣区域之外的块。
用于每个块的每个比特数据流,可以以每个块编码的顺序排队成一个用于整个图像的编码比特数据流,或用于感兴趣区域内部的块的比特流可以首先排队,用于重叠感兴趣区域的边界的块的比特数据流可以其次排队,并且用于感兴趣区域之外的块的比特数据流可以最后排队。在后者情况中,用于每个块的编码标记必须具有指定在该图像之内的一个位置的位置信息。
根据指定到用于每个块的比特部分的编码标记,用图2中的解码方法实现解码(如果图1中的编码方法被使用),或用图12中的解码方法实现解码(如果图11中的编码方法被使用)。以表示在感兴趣区域之内或之外的一标记为前导的比特部分的解码的执行不使用ROI功能。如果感兴趣区域的内部的块的编码是通过使用ROI功能,例如ROI系数定标实现的,则感兴趣区域之内的块的解码需要用ROI功能实现。以表示重叠该感兴趣区域的一标记为前导的比特部分的解码的执行使用ROI功能。
默认时,在感兴趣区域之内的块被分配最高的比特率,重叠该感兴趣区域的块被分配次最高的比特率,而感兴趣区域之外的块被以一个给定比特率分配最低的比特率。然而,每一块的比特率可以被独立地控制。如果解码方想要以较高逼真度重建未被指定为感兴趣区域的区域,则在重新定义的区域之内的部分被指定一更高的比特率。
当子带分类使用在图1或图11那样的编码器中时,每个子带被划分成包括变换系数的几个序列。不是在每一子带中执行ROI系数定标,ROI系数定标是对于量化指数或对于每一序列中的变换系数执行的。还对每个序列的按比例增加结果执行熵编码。如果每个序列被认为是在图1或图11中的编码方法的每个子带,编码方法可以是图1或图11中的一个编码方法。在从子带产生每个序列之后,通过把每一序列作为每一子带处置,基于序列的技术以图1和图11的编码方法利用每种ROI系数定标技术操作。
当通过使用一个子带分类技术的编码方法产生图像的编码比特数据流时,实行熵解码和ROI系数解定标,以便获得包括系数的每一个序列。然后,从相同的子带起源的几个序列被解划分成每个子带,以便能够执行反相子波变换。如果用于每个序列的每个比特部分被认为是用于每个子带的一个比特部分,则以根据图2或12的一种解码方法实行解码。象该编码方法一样,为了执行反相子波变换,通过把每一序列作为在每个步骤中的子带处置,直到形成子带的序列为止,图2或12中描述的解码方法与子带分类技术一起操作。
当对于图1或11的编码方法中的每个子带或每个序列中的每个系数的块实行熵编码时,对于每一系数数据块执行根据图3A-6C的ROI系数定标方法以及根据图7A-8C的熵编码方法。为了对于系数的每一数据块执行熵编码,每一子带或系数的每个序列被分成系数数据块。每个子带或序列可以被分成相同形状或不同形状的块。该块可以是矩形、正方形或条线形,或可以是矩形、正方形或条线形的某些或全部的组合。为了降低用于处理每一块的计算复杂性,全部子带可以具有相同的形状的相等的块数或,也可以具有相同的形状的相等的块大小。每个块被独立地编码。不对应于感兴趣区域的块的编码不使用ROI系数定标方法。示出感兴趣区域之外的块的编码标记被附加到块的编码比特数据流。对应于感兴趣区域的块的编码使用ROI系数定标方法。示出对应于感兴趣区域的块的编码标记被附加到该块的编码比特数据流。该编码标记可以说明块中的全部系数对应于感兴趣区域或块中的某些系数对应于感兴趣区域。当块中的全部系数对应于感兴趣的区域时,编码可以实行而不使用ROI系数定标方法。
做为选择,具有对应于感兴趣区域的系数的块以及对应于感兴趣区域之外区域的系数的块,能够被分类为其系数完全属于该感兴趣区域的块或其系数完全属于该感兴趣区域之外的区域的块。该分类是根据对应于感兴趣区域的系数的数量、对应于感兴趣区域的系数的数量与每个块中的系数的数量的比例或任何其它判据。用于全部块的编码的实行不使用该ROI系数定标方法。相反,把每一块的编码比特数据流区别为一个用于感兴趣区域的数据流或一个用于感兴趣区域之外区域的数据流的编码标记,被加到每个块的编码比特数据流,以便该解码器能够指定哪个比特部分对应于感兴趣的区域。
当对于每一子带或序列之内的系数的每个块实行熵编码时,对应于编码方使用的熵编码方法和ROI系数定标方法的熵解码和ROI系数解定标方法,如图2或12使用的那样,被在每个块上执行。在此解码环境中,在编码方未指定的感兴趣的区域或完全地由解码方指定的感兴趣的区域能够以比该图像的其余区域更高的逼真度重建,或可以被有选择地重建。根据新近指定的感兴趣区域,根据图9中的方法,对应于感兴趣区域的变换系数被指定。包括对应于新近定义的感兴趣区域的系数的系数块被以比该子带中其它块更高的比特率重建。仅包括对应于感兴趣区域的系数的系数块将被分配最高的比特率。包括对应于感兴趣区域和对应于感兴趣区域之外的区域的系数的系数块将被分配相同的比特率、较低的比特率、或最低的比特率。不包括对应于感兴趣区域的系数的系数块将被分配最低的比特率。如果0比特被分配到一个块,则该块将不被用于重建图像。
对每个块的比特分配,可以根据对应于每个块中的感兴趣区域的系数的数量更多精确地执行。在一块中的对应于感兴趣区域的系数的数量越大,将被分配的重建该图像的比特率数越大。比特分配可以根据任何判据完成,其判据反映在感兴趣的区域或整个图像的重建中每个系数的重要程度。例如,能够根据该系数是否对应于感兴趣的区域、该系数表示在感兴趣的区域中多少像素、由该系数表示的像素的何种百分数属于感兴趣的区域来定义每个系数的重要程度。全部或某些判据被使用,连同对应于每一块中感兴趣区域的系数的数量,以便确定被分配到系数块的比特速率数。
不是通过使用用于每个块的判据分配比特或比特速率,系数块的编码或解码排序能够以这样的方式确定,即将要分配较高比特率的块被给定一个较早的编码或解码排序。可以根据针对每一块的判据定义任何其它排序。
图14是根据本发明的解码数据的另一方法的流程图。本方法首先假定步骤130提供对应于一个图像的数字数据。然后通过用户在步骤132中选择感兴趣的图像区域。然而,本发明还包括通过一个方法,其中一个自动目标识别系统根据一组判据定义一个或几个感兴趣的区域。该自动目标识别系统可以使用多种方法以便标识感兴趣的区域。例如,模式识别软件可以用于标识图像中感兴趣的目标。在该图像中选择了感兴趣区域之后,对于该数字图像数据执行子波变换,以便获得包括系数的一组子带134。如上讨论,若干不同的子波变换类型,例如锤(mallet)类型变换、宽域(spacl)子波变换、分组(packet)类型变换等等,可以使用获得该系数。对应于所选感兴趣区域的系数在步骤136被标识。然后在步骤138排序该系数,以便至少一个对应于数字图像数据的系数的类别表示感兴趣的区域。然后在步骤140根据该系数安排在其中的该类别把该系数熵编码。通过把系数排序成对应于感兴趣区域的类别,使得有可能独立地处理和压缩该图像的不同区域。在图像的大部分组成相对无特色的背景的环境中,这是很宝贵的。
有几种不同方法确定感兴趣区域将被压缩的程度。一种方法是让用户选择压缩的程度。另一在图15中示出的方法是,在步骤142确定用于编码表示图像的数字数据的数字比特的总数。在步骤144确定用于图像的不同区域的优先级。根据区域的优先级,从比特的总数来的比特随后在步骤146和148被分配用于编码该图像的各种区域,使得高优先级区域能够被比低优先级区域更精确地重建。通常,发送装置具有发送比特数据流的一个设置的比特率。根据本发明,将要传送的比特数据流的一部分在步骤150被分配用于发送该图像的高优先级区域。例如,如果该比特数据流被以1000比特/秒的一个速率发送,则800比特/秒可以分配用于发送表示高优先级的图像区域的编码数据,而200比特/秒可以分配用于发送表示低优先级的图像区域的编码数据。一旦该比特数据流的部分被在步骤150分配用于高优先级编码数据的发送,则在步骤152把该比特数据流发送到一个远端的位置。一旦对应于图像高优先级区域的全部编码数据已经被发送,则在步骤154把整个比特数据流分配到对表示该图像的较低优先级区域的编码数据的发送。
图16示出本发明编码装置的一种实施例的方框图。图像数据600被提供到一个子波转换器602。子波转换器602执行该图像数据600的一个子波变换以便获得包括系数的子带。感兴趣区域系数标识器604接收感兴趣区域的坐标以及来自子波转换器602包括系数的子带,并且标识对应于该感兴趣区域的系数。
如上讨论,从对应于感兴趣区域的子波变换获得的系数的标识,是通过跟踪从图像域到子波域的反相的子波变换实现的。以此方式,用于重建每个像素的一组子波变换系数能够被独立地标识。因此,感兴趣区域的系数的标识与感兴趣区域的形状无关,并且感兴趣区域能够包括不连接的区域。子带分类器608分类该系数并且产生一个分类图610。分类系数被发送到一个量化器612和一速率分配装置618。该速率分配装置618把一个量化步长分配到系数的每一类,并且提供这速率到量化器612。速率分配装置618还产生一个量化表,其包括与分配到每个子带种类的量化步长相关的信息。该量化器612量化该系数并且提供量化的系数到一个熵编码器614。熵编码器614根据提供到熵编码器614的与感兴趣区域相关的已收优先级信息616编码该量化系数。熵编码器614的输出是一个编码比特数据流622。
图17示出本发明解码装置的一种实施例的方框图。一个编码的比特数据流622和感兴趣区域的优先级信息616被熵解码器624接收。熵解码器624产生一个提供到反相量化器626的量化输出。反相量化器626还根据一个量化表620从一个速率解分配器628接收量化信息。该反相量化器626产生发送到一个子带解分类器630的系数。该子带解分类器630根据一个接收的分类图解分类该系数,以便产生一组被提供到一反相子波转换器630的子带。反相子波转换器630对于该子带执行一个反相子波变换,以便获得可用于重建一个图像的图像数据632。图18示出一个实施例,其中该装置包括一个发送方800,发送方800编码该图像并且把该解码的数据发送到接收和显示该图像的接收方802。发送方800具有一个利用感兴趣区域功能的编码器804。最初,编码器804编码一个低分辨率、低逼真度或低比特率的图像版本,并且发送该编码的版本到发送装置806。发送装置806发送该编码的信号到定位在接收方802的接收装置808。发送可以通过有线的传输信道或无线传输信道实现。接收方802的接收装置808接收该编码的信号,并且提供该信号到一个利用感兴趣区域功能的解码器810。解码器810解码该图像并且发送该解码图像到一个显示器812,其中该图像被显示到一个用户。接收方802具有一个感兴趣区域选择器814,其允许用户选择在该显示图像中的一个感兴趣区域。接收方802还具有一个感兴趣区域优先级选择器816,其允许用户选择优先级,利用该优先级编码感兴趣的区域。例如,可以选择优先级以使感兴趣的区域将被无失真重建。一旦一个感兴趣的区域和一个优先级已经被选择,感兴趣的区域814和优先级816选择器把关于该选择的信息提供到解码器810以及一个发送装置818。发送装置把该信息反馈到发送方800的接收装置820。接收装置820接收该信息并且提供该信息到编码器804。如先前讨论的那样,编码器804随后根据该信息优先编码该选择的感兴趣区域,然后把该编码的感兴趣区域信息发回到接收方802。该过程可以被重复,以使该用户能够根据在先的感兴趣区域的检验而改进感兴趣的区域。因此,上述讨论的实施例允许接收方的用户交互地确定感兴趣区域的编码。
本发明的另一应用包括把上述的感兴趣区域的构思集成到一个数字照相机。在这样一个应用中,感兴趣区域以及用于编码该区域的判据,是通过该数字照相机的用户在照相机的视图寻像器或显示器上选择的。该照相机随后根据该判据记录在感兴趣区域中的信息。通过以高清晰度或保真度仅记录一个选择的感兴趣区域,需要存储该数字图像的存储空间的需求可以被降低。因为大多数的数字照相机中的存储空间是非常有限的,所以这样一个应用特别有益。
还理解到,上述讨论的编码方法与装置还可以被应用到数字再生的运动图像。例如,正被发送的一个比特数据流的所选部分允许实时再生一种图像,该图像能够专用于发送生成运动图像中的一个感兴趣区域。而且,该感兴趣区域的尺寸以及位置能够随着运动图像的发展被不断地改变。
上述的本发明的描述仅用于说明的目的。应该理解,根据本发明的一个感兴趣区域的选择以及重建可以由其它类型的压缩方法使用,上述公开的各种装置具有很多的等同物,这将在本专业技术人员的知识范围之内。本发明的界定以所附的权利要求书定义。
Claims (31)
1.一种图像压缩方法,所述方法包括步骤:
提供包括与用于多个像素的数值和坐标有关的数据的数字图像数据;
标识由所述数字图像数据表示的一个图像的至少一个感兴趣区域;
根据至少两个优先级类别对所述数字图像数据的优先级进行分类和划分,加重对应于所述至少一个感兴趣区域的数字图像数据,以使得对应于所述感兴趣区域的数字图像数据所具有的优先级比对应于该感兴趣区域之外的区域的数字图像数据更高;和
对所述数字图像数据进行编码,以根据所述数字图像数据的优先级形成一个比特数据流。
2.根据权利要求1的图像压缩方法,进一步包括步骤:
将被编码的所述数字图像数据发送到一远端位置,其中对应于所述感兴趣区域的所述数字数据与所述感兴趣区域之外的区域相比,其发送具有更高的优先级。
3.如权利要求2的图像压缩方法,其中所述将被编码的数字图像数据发送到所述远端位置的步骤包括:与对应于所述感兴趣区域之外区域的图像数据相比,以一个更高速率发送对应于所述感兴趣区域的数字图像数据,以使得该感兴趣区域能够以一个比所述感兴趣区域之外区域更高的保真度重建。
4.一种图像压缩方法,所述方法包括步骤:
在数字图像数据中执行全部像素值的子波变换,以获得变换系数;
标识对应于至少一个感兴趣区域的变换系数;
通过按比例增加对应于所述感兴趣区域的变换系数,加重对应于该感兴趣区域的变换系数;
对包括该按比例增加的变换系数的变换系数排序;和
对该变换系数进行熵编码,以形成一个比特数据流。
5.一种用于编码和解码一个图像的方法,所述方法包括步骤:
以一种计算机可读格式提供数字图像数据,所述数字图像数据包括与用于多个像素的数值和坐标有关的数字图像数据;
根据至少两个优先级类别对该整个图像的所述数字图像数据进行分类,加重对应于所述至少一个感兴趣区域的数字图像数据,以使得对应于所述感兴趣区域的数字图像数据所具有的优先级比对应于该感兴趣区域之外的区域的数字图像数据更高;
把所述分类数据发送到一个接收机,并且重复所述的分类和发送,直到在接收机的一个显示器上出现一个部分重建图像;
根据所述部分重建图像选择一个感兴趣区域;
把所选感兴趣区域的数据从所述接收机发送到发送方以便进行标识;
根据所选感兴趣区域修改所述数字图像数据的分类,其中对应于该感兴趣区域的数字图像数据经过分类和优先级划分,而使其与对应于该感兴趣区域之外区域的数字图像数据相比,具有更高的优先级;以及
把所述修改后的经过分类和优先级划分的数字图像数据发送到该接收机,其中所述感兴趣区域与该感兴趣区域之外的区域相比,其对应的数字信息数据的发送具有更高的优先级。
6.如权利要求5的用于编码和解码一个图像的方法,其中所述发送所述分类数据的步骤包括:把所述分类数据发送到一个网络,其中所述接收机是一台在所述网络上的接收计算机,并且其中所述选择该感兴趣区域的步骤是以所述接收计算机执行的。
7.一种编码表示一个图像的数字数据的方法,该方法包括步骤:
以一种计算机可读格式提供数字图像数据,该数字图像数据包括与用于至少一个图像的数值和坐标有关的数字图像数据;
选择由该数字图像数据表示的一个图像的至少一个感兴趣区域;
对于该数字图像数据执行一个子波变换,该子波变换是从包括一个锤状类型子波变换、宽域类型子波变换、和一个分组类型子波变换中选择的,以便获得包括变换系数的子带;
标识对应于至少一个所选感兴趣区域的变换系数;
对于每个感兴趣区域指定一个优先级;
把在每个子带中的变换系数分类而形成至少一个序列;
把一个比特速率分配到所述变换系数的每一序列;
通过一个根据被分配的速率选择的量化方案,量化在每一序列中的变换系数;
根据针对每一感兴趣区域指定的优先级,按比例增加包括对应于每个感兴趣区域的量化变换系数的比特平面的比特有效级别;
根据所述变换系数的按比例增加的比特有效级别,修改包括量化变换系数的比特平面的一个编码排序;以及
根据该修改的编码排序,对该量化变换系数的比特平面进行熵编码,以便产生数字图像数据的一个编码的比特数据流。
8.如权利要求7的方法,进一步包括步骤:标识对于编码该感兴趣区域来说必需并且是足够的系数,以便在一个目标空间分辨率图像中以一个最高的保真度重建所述感兴趣区域。
9.如权利要求7的方法,其中标识对应于该感兴趣区域的系数的步骤进一步包括步骤:
标识在该感兴趣区域的边界上的像素;
如果执行子波变换和反相子波变换的低通和高通滤波器的至少其中之一具有一个奇数的滤波器长度,则沿着该图像的垂直和水平方向之一标识该感兴趣区域之内一个像素的像素;
把该子波变换和反相子波变换之一的输入-输出关系从一个图像域跟踪到每个子带域,以便标识对应于在先步骤中标识的该像素的变换系数;
根据所标识的在先步骤中的系数,形成每个子带域中的一个相应的感兴趣区域的边界;和
把每个子带中由该边界环绕的系数标识为对应于该感兴趣区域的系数。
10.如权利要求7的方法,其中标识对应于该感兴趣区域的系数的步骤进一步包括步骤:
通过跟踪在像素上执行的一组子波变换和一组重建一个像素值的反相子波变换之一的输入-输出关系,标识对应于所述感兴趣区域中的每一像素的一组变换系数;和
形成一个系数标识结果,使得能够标识对应于每个像素的一组变换系数。
11.如权利要求7的方法,其中对该比特平面进行熵编码的步骤产生若干比特形式的编码信息,并且该方法进一步包括步骤:
分别地对比特的数量进行分配,用于表示仅包括对应于在每个变换系数序列中的所述感兴趣区域的变换系数的比特平面、用于表示包括同一序列中的所有变换系数的比特平面、和用于表示包括对应于在同一序列中的所述感兴趣区域之外区域的变换系数的比特平面,而使得重建该感兴趣区域的比特的数量和重建该感兴趣区域之外区域的比特的数量将被分别地控制;和
排队该比特平面的编码比特部分,使得与表示该感兴趣区域之外区域的比特部分相比,表示该感兴趣区域的比特部分的一个确定系列将在的更早的发送阶段被发送。
12.根据权利要求7的方法,其中所述选择感兴趣区域的步骤进一步包括步骤:在该图像中选择多个感兴趣区域,并且为每个区域指定一个优先级;并且其中把每个子带中的变换系数分类而形成至少一个序列的步骤进一步包括步骤:分级该变换系数,使得至少一个序列对应于所述多个感兴趣区域中的每一个。
13.如权利要求7的方法,其中对于一个数字图像执行子波变换的步骤进一步包括步骤:把该图像划分成像素的矩形块,使得一些块只包括位于所述感兴趣区域内部的像素,而一些块只包括位于所述感兴趣区域之外的像素,并且一些块包括位于该感兴趣区域内部的一些像素以及位于该感兴趣区域之外的一些像素,并且对于每个矩形像素块执行子波变换,以及该方法进一步包括步骤:
通过对要被包括在所述感兴趣区域之中的矩形块,选择其全部像素,而对其中存在着在所述感兴趣区域和该感兴趣区域之外区域之间的边界的矩形块,单独地选择要被包括在该感兴趣区域之中的像素,而定义该感兴趣区域;
根据指定到该感兴趣区域的优先级,按比例增加对应于完全在该感兴趣区域中的矩形像素块的全部变换系数的比特有效级别,以及按比例增加对应于在重叠该感趣区域边界的块中的、属于该感兴趣区域的像素的变换系数的比特有效级别;
根据对该感兴趣区域内部的变换系数的比特有效级别所进行的按比例增加,修改在重叠该感兴趣区域边界的块中的量化变换系数的比特平面的一个预定的编码排序;
根据该预定的编码排序,对不重叠该感兴趣区域边界的块中的量化变换系数的比特平面进行熵编码,并且根据该修改的编码排序,对在重叠该感兴趣区域边界的块中的量化变换系数的比特平面进行编码;和
通过对该感兴趣区域指定一个优先级值,调节全部块的比特平面的编码比特序列的排序,使得在该感兴趣区域内部的块中的比特平面的比特序列的排序被给予较高优先等级,而在该感兴趣区域之外的块和重叠该感兴趣区域的块中的比特平面的比特序列的排序与该相应的块的编码排序相同,以便产生所述数字数据的编码的比特数据流。
14.如权利要求7的方法,其中所述进行熵编码的步骤进一步包括:对于该系数执行数据压缩,使得关于所述感兴趣区域之外区域的信息丢失多于该感兴趣区域的信息丢失。
15.一种解码表示一个图像的信息的方法,该方法包括步骤:
接收一种计算机可读格式的信息,该被接收信息包括表示一个图像的数字数据以及关于在该图像中的至少一个感兴趣区域的数字数据;
根据关于该至少一个感兴趣区域的信息,在将要以编码比特数据流重建的图像中定位至少一个感兴趣区域;
标识对应于指定的感兴趣区域的数字数据;
根据指定到每个感兴趣区域的优先级,修改该编码比特数据流的一个解码排序;
根据该修改的解码排序,对该编码比特流进行熵解码,以便获得对应于具有相同比特有效级别的量化变换系数的比特平面;
按比例降低包括对应于每个感兴趣区域的量化变换系数的比特平面的比特有效级别,以便获得该量化变换系数的原始的比特有效级别;
根据一个解量化方案,解量化该量化变换系数,以便获得变换系数的序列;
把变换系数的序列解分类而形成一组子带;以及
对于该子带执行一个从锤类型变换、宽域类型变换以及分组类型变换中选择的反相子波变换,以便重建该数字图像数据。
16.如权利要求15的方法,进一步包括步骤:
分别地标识在对该编码比特数据流进行熵解码时所使用的一部分比特数,以便获得仅包括对应于该感兴趣区域的比特平面、用于获得包括同一序列中的所有变换系数的比特平面、和用于获得包括在同一序列中的该感兴趣区域之外的变换系数的其余的比特平面,使得用于重建该感兴趣区域的比特的数量和用于重建该感兴趣区域之外区域的比特的数量将被分别地控制;以及
排列被接收的编码比特数据流的各部分,使得表示该感兴趣区域的比特部分的一个确定的系列,在该感兴趣区域的重建中的较早阶段被解码。
17.如权利要求15的方法,其中接收该信息的步骤进一步包括步骤:接收该信息,而使得对应于所述感兴趣区域的信息被接收的速率高于对应于该感兴趣区域之外的图像区域的信息被接收的速率。
18.如权利要求15的方法,其中标识对应于该感兴趣区域的数字数据的步骤进一步包括步骤:
标识对应于由该信息表示的图像中的多个感兴趣区域的数字数据;
确定对应于所述多个感兴趣区域中的每一个的优先级;以及
以根据每一个区域的被确定的优先级的方式,通过重建所述多个感兴趣区域而重建该图像。
19.如权利要求15的方法,其中该数字图像数据的编码比特数据流包括表示在该图像中的像素矩形块的编码比特平面组,该方法进一步包括步骤:
根据对该感兴趣区域指定的优先级值,修改用于与该感兴趣区域的边界重叠的矩形块的编码比特平面的一个解码排序;
根据一个解码排序,对用于不与该感兴趣区域的边界重叠的矩形块的编码比特平面进行熵解码,并且根据被修改的解码排序,对用于与该感兴趣区域的边界重叠的矩形块的编码比特平面进行熵解码,以便获得包括在每个序列中的量化变换系数的相同比特有效级别的比特平面;
根据对该感兴趣区域指定的优先级值,按比例降低该比特平面的比特有效级别,该比特平面仅包括对应于在重叠该感兴趣区域边界的块中的感兴趣区域的量化变换系数,以便获得该比特平面的原始比特有效级别;和
对于包括量化变换系数的每个子带组执行一个反相子波变换,以便重建该数字图像中的每个矩形块。
20.一种用于编码表示一个图像的信息的编码装置,该装置包括:
接收装置,用于接收包括与用于多个像素的数值和坐标有关的数据的信息;
子波变换装置,用于对该信息执行一个子波变换以便获得包括系数的子带,该子波变换是从锤状类型子波变换、宽域类型子波变换、和分组类型子波变换中选择的;
标识装置,用于标识对应于至少一个感兴趣区域的系数;
分类装置,用于根据多个类别对该系数进行分类,其中至少一个类别对应于表示该感兴趣区域的系数,并且至少一个类别对应于表示该感兴趣区域之外的区域的系数;
熵编码装置,用于根据该类别编码该系数,该系数被放置到该类别中,以便获得表示该编码系数的若干比特;和
发送装置,用于把一个比特数据流中的比特发送到一个远端位置,使得其中的比特被发送的方式取决于该比特对应的系数类别。
21.如权利要求20的编码装置,进一步包括:
量化装置,用于接收来自所述标识装置的系数,且量化所述系数,并将被量化系数提供给所述熵编码装置;和
分配装置,用于根据系数类别来分配量化步长。
22.如权利要求20的编码装置,其中所述熵编码装置进一步包括优先级编码功能,以根据所述感兴趣区域的优先级信息来进行编码。
23.如权利要求20的编码装置,其中所述分类装置进一步包括块排序功能,以根据类别而对该系数排序,使得一些系数类别包括对应于所述图像中的像素的矩形块的信息,其中在相应的块中的全部像素均处于该感兴趣区域的内部或该感兴趣区域的外部,并且一些系数的类别包括对应于所述图像中的像素的矩形块的信息,其中在该相应块中的一些像素处于该感兴趣区域的内部,而一些像素则处于该感兴趣区域的外部。
24.一种用于接收并且解码表示一个图像的信息的解码装置,该装置包括:
接收装置,用于接收包括与用于多个像素的数值和坐标有关的数据的信息;
熵解码装置,用于根据从所述接收装置接收到的该信息的类别,对该信息进行熵解码;
反向量化装置,用于从被熵解码的所述信息产生子带系数;
子带解分类装置,用于根据分类而分解来自所述反相量化装置的子带系数,以产生子带;
反向子波变换装置,用于对所述子带执行反向子波变换以重建图像。
25.如权利要求24的解码装置,进一步包括:
解分配装置,用于为所述反向量化装置提供量化信息,该量化信息与所述子带的类别的量化步长有关。
26.如权利要求24的解码装置,其中该接收装置在接收对应于该感兴趣区域之外的图像区域的信息之前,接收对应于该感兴趣区域的信息。
27.如权利要求24的解码装置,其中所述熵解码装置进一步包括优先级解码功能,以根据根据所述感兴趣区域的优先级信息来进行熵解码。
28.如权利要求24的解码装置,其中所述子带解分类装置是根据分类表来进行分类的。
29.一种编码表示一个图像的数字图像数据的方法,所述方法包括步骤:
在由所述数字图像数据表示的一个图像中选择至少一个感兴趣区域;
对于该数字图像数据执行执行一个子波变换,以便获得变换系数;
标识对应于该感兴趣区域的变换系数;
根据指定到该至少一个感兴趣区域的优先级,编码所述感兴趣区域,以形成一个比特数据流;
通过按比例增加对应于所述感兴趣区域的变换系数,加重对应于该感兴趣区域的变换系数;
对包括该按比例增加变换系数的变换系数排序;
对包括该按比例增加变换系数的变换系数进行量化;和
对该变换系数进行熵编码,以形成一个比特数据流。
30.根据权利要求29的方法,还包括步骤:
量化该变换系数,以便获得量化指数;
通过按比例增加对应于感兴趣区域的量化指数,加重对应于该感兴趣区域的量化指数;
排序量化指数,包括该按比例增加的量化指数;和
对该量化指数进行熵编码,以形成一个比特数据流。
31.一种用于产生表示一个图像的数字图像数据的数字照相机,该数字照相机包括:
数字图像数据产生装置,用于产生表示一个图像的数字图像数据;
子波变换装置,用于对该数字图像数据执行一个子波变换,以便获得变换系数;
标识装置,用于标识对应于所述至少一个感兴趣区域的变换系数;
分类装置,用于根据多个类别的变换系数,对该变换系数进行分类,其中至少一个类别对应于表示所述感兴趣区域的系数,而至少一个类别对应于表示该感兴趣区域之外区域的系数;
编码装置,用于编码该变换系数,以使得对应于该感兴趣区域的变换系数被编码,其编码方式是使得在该图像中的该感兴趣区域比该感兴趣区域之外的图像区域被更精确地重建;和
存储装置,用于存储被编码的该变换系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
USPCT/US98/03811 | 1998-03-20 | ||
PCT/US1998/003811 WO1999049413A1 (en) | 1998-03-20 | 1998-03-20 | Lossy/lossless region-of-interest image coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1291314A CN1291314A (zh) | 2001-04-11 |
CN1231863C true CN1231863C (zh) | 2005-12-14 |
Family
ID=22266476
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988139065A Expired - Lifetime CN1175373C (zh) | 1998-03-20 | 1998-03-20 | 有损失/无损失感兴趣区域图像编码的方法和系统 |
CNB988139057A Expired - Lifetime CN1231863C (zh) | 1998-03-20 | 1998-09-15 | 用于进行图像压缩和解压缩的方法与装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988139065A Expired - Lifetime CN1175373C (zh) | 1998-03-20 | 1998-03-20 | 有损失/无损失感兴趣区域图像编码的方法和系统 |
Country Status (7)
Country | Link |
---|---|
EP (6) | EP1062625A4 (zh) |
JP (1) | JP3597780B2 (zh) |
KR (2) | KR100550105B1 (zh) |
CN (2) | CN1175373C (zh) |
AU (2) | AU6441398A (zh) |
DE (2) | DE69842222D1 (zh) |
WO (2) | WO1999049413A1 (zh) |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512291C2 (sv) * | 1997-09-23 | 2000-02-28 | Ericsson Telefon Ab L M | Inbäddad DCT-baserad stillbildskodningsalgoritm |
JP2001293915A (ja) * | 2000-04-14 | 2001-10-23 | Canon Inc | 印刷装置及びその制御方法、コンピュータ可読メモリ |
JP2002064709A (ja) * | 2000-06-06 | 2002-02-28 | Canon Inc | 画像処理装置及びその方法とそのコンピュータプログラム及び記憶媒体 |
JP2001359117A (ja) * | 2000-06-15 | 2001-12-26 | Canon Inc | 画像処理装置及び該装置における画像処理方法 |
JP4615105B2 (ja) * | 2000-09-07 | 2011-01-19 | ジーイー・メディカル・システムズ・グローバル・テクノロジー・カンパニー・エルエルシー | 超音波撮影装置 |
FR2815748B1 (fr) * | 2000-10-20 | 2003-01-24 | Canon Kk | Procede et dispositif de traitement et de decodage d'un signal numerique code |
FR2816138B1 (fr) * | 2000-10-27 | 2003-01-17 | Canon Kk | Decodage de donnees numeriques |
WO2002078351A1 (de) * | 2001-03-27 | 2002-10-03 | Voxar Ag | Verfahren und vorrichtung zur übertragung von video- und/oder audiodaten |
AUPR432701A0 (en) * | 2001-04-10 | 2001-05-17 | Lions Eye Institute Of Western Australia Incorporated, The | Virtual service system for client and service provider users and method therefor |
JP5388393B2 (ja) * | 2001-04-27 | 2014-01-15 | キヤノン株式会社 | 画像処理装置および画像処理方法、制御プログラム |
FR2826227B1 (fr) | 2001-06-13 | 2003-11-28 | Canon Kk | Procede et dispositif de traitement d'un signal numerique code |
FR2827409B1 (fr) | 2001-07-10 | 2004-10-15 | France Telecom | Procede de codage d'une image par ondelettes permettant une transmission adaptative de coefficients d'ondelettes, signal systeme et dispositifs correspondants |
KR100440953B1 (ko) * | 2001-08-18 | 2004-07-21 | 삼성전자주식회사 | 영상 압축 비트 스트림의 트랜스코딩 방법 |
US6882755B2 (en) * | 2001-10-19 | 2005-04-19 | Hewlett-Packard Development Company, L.P. | Image transmission for low bandwidth with region of interest |
GB2382940A (en) | 2001-11-27 | 2003-06-11 | Nokia Corp | Encoding objects and background blocks |
KR20020008101A (ko) * | 2001-12-12 | 2002-01-29 | 주식회사 애니콤소프트웨어 | 데이터의 비트 인덱스 압축방법 |
US7106366B2 (en) | 2001-12-19 | 2006-09-12 | Eastman Kodak Company | Image capture system incorporating metadata to facilitate transcoding |
KR100460947B1 (ko) * | 2002-01-16 | 2004-12-09 | 삼성전자주식회사 | 영상신호 처리장치 및 방법 |
US7174050B2 (en) * | 2002-02-12 | 2007-02-06 | International Business Machines Corporation | Space-optimized texture maps |
CN1640146A (zh) * | 2002-03-05 | 2005-07-13 | 皇家飞利浦电子股份有限公司 | 用于分层视频编码的方法和系统 |
US7228000B2 (en) | 2002-03-15 | 2007-06-05 | Ricoh Co., Ltd. | Image data generation with reduced amount of processing |
EP1349393A1 (en) | 2002-03-15 | 2003-10-01 | Ricoh Company | Image compression device, image decompression device, image compression/decompression device, program for executing on a computer to perform functions of such devices, and recording medium storing such a program |
US20040022447A1 (en) * | 2002-07-31 | 2004-02-05 | General Electric Company | Method and system for image compression and decompression using span of interest of an imaging sequence |
JP4003945B2 (ja) | 2002-08-26 | 2007-11-07 | 株式会社リコー | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
JP4135888B2 (ja) | 2002-09-18 | 2008-08-20 | 株式会社リコー | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
GB0227743D0 (en) * | 2002-11-28 | 2003-01-08 | Rolls Royce Plc | Wavelet compression |
CN1655620B (zh) | 2004-02-09 | 2010-09-22 | 三洋电机株式会社 | 图像显示装置 |
WO2005112467A1 (en) * | 2004-05-13 | 2005-11-24 | Koninklijke Philips Electronics N.V. | Method and device for encoding blocks of values |
CN102790880B (zh) * | 2004-06-15 | 2015-04-08 | 思科技术公司 | 用于视频压缩的混合可变长度编码的方法和设备 |
US7720295B2 (en) | 2004-06-29 | 2010-05-18 | Sanyo Electric Co., Ltd. | Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality |
US7747095B2 (en) * | 2004-10-08 | 2010-06-29 | Nvidia Corporation | Methods and systems for rate control in image compression |
JP4656912B2 (ja) | 2004-10-29 | 2011-03-23 | 三洋電機株式会社 | 画像符号化装置 |
JP2006129248A (ja) * | 2004-10-29 | 2006-05-18 | Sanyo Electric Co Ltd | 画像符号化方法および装置、ならびに画像復号方法および装置 |
US8768084B2 (en) | 2005-03-01 | 2014-07-01 | Qualcomm Incorporated | Region-of-interest coding in video telephony using RHO domain bit allocation |
US8693537B2 (en) | 2005-03-01 | 2014-04-08 | Qualcomm Incorporated | Region-of-interest coding with background skipping for video telephony |
CN101171841B (zh) * | 2005-03-09 | 2012-06-27 | 高通股份有限公司 | 用于视频电话的关注区提取 |
US8019175B2 (en) | 2005-03-09 | 2011-09-13 | Qualcomm Incorporated | Region-of-interest processing for video telephony |
US8977063B2 (en) | 2005-03-09 | 2015-03-10 | Qualcomm Incorporated | Region-of-interest extraction for video telephony |
CN100425066C (zh) * | 2005-09-23 | 2008-10-08 | 逐点半导体(上海)有限公司 | 图像压缩的方法 |
US8406290B2 (en) * | 2005-12-28 | 2013-03-26 | Intel Corporation | User sensitive information adaptive video transcoding framework |
KR100776822B1 (ko) * | 2006-04-11 | 2007-11-19 | 고려대학교 산학협력단 | 스테레오 잔여 영상 부호화 방법 및 그 장치 |
KR101521041B1 (ko) * | 2006-05-25 | 2015-05-15 | 톰슨 라이센싱 | 가중 인코딩을 위한 방법 및 시스템 |
GB2447245B (en) * | 2007-03-05 | 2011-12-28 | Snell & Wilcox Ltd | Video transmission |
CN101309259B (zh) * | 2008-06-24 | 2012-07-11 | 广东威创视讯科技股份有限公司 | 一种分布式图像显示方法 |
JP5364459B2 (ja) * | 2009-06-15 | 2013-12-11 | オリンパス株式会社 | 画像送信装置、画像受信装置、画像送信方法、画像受信方法、及びプログラム |
US10514541B2 (en) * | 2012-12-27 | 2019-12-24 | Microsoft Technology Licensing, Llc | Display update time reduction for a near-eye display |
GB2512829B (en) | 2013-04-05 | 2015-05-27 | Canon Kk | Method and apparatus for encoding or decoding an image with inter layer motion information prediction according to motion information compression scheme |
KR101489449B1 (ko) * | 2013-04-16 | 2015-02-06 | 주식회사 비즈모델라인 | 적응형 무선인식 장치 |
US20150237351A1 (en) * | 2014-02-18 | 2015-08-20 | Penne Lee | Techniques for inclusion of region of interest indications in compressed video data |
RU2557755C1 (ru) * | 2014-02-25 | 2015-07-27 | Открытое акционерное общество "Центр судоремонта "Звездочка" | Способ сжатия изображения при фрактальном кодировании |
CN105761212A (zh) * | 2014-12-15 | 2016-07-13 | 南京理工大学 | 基于dmd编码的哈达码变换高灵敏成像的方法 |
RU2628122C1 (ru) * | 2015-03-09 | 2017-08-15 | Открытое Акционерное Общество "Пеленг" | Способ аппаратного сжатия цифрового изображения для съемочной аппаратуры сканирующего типа |
CN106302564B (zh) * | 2015-05-13 | 2019-08-06 | 宏碁股份有限公司 | 文件传输方法、装置与系统 |
JP2018182569A (ja) * | 2017-04-14 | 2018-11-15 | 株式会社メガチップス | 画像処理装置、画像処理システム、情報処理システム及び画像処理方法 |
KR101906066B1 (ko) * | 2017-07-31 | 2018-10-08 | 서울과학기술대학교 산학협력단 | 다중 시점 영상의 송신 방법 및 장치 |
CN112313951A (zh) * | 2018-06-28 | 2021-02-02 | 苹果公司 | 低延迟视频编码和传输的速率控制 |
WO2020006291A1 (en) | 2018-06-28 | 2020-01-02 | Apple Inc. | Priority-based video encoding and transmission |
EP3815368A1 (en) | 2018-06-28 | 2021-05-05 | Apple Inc. | Video encoding system |
RU2723896C1 (ru) * | 2018-11-06 | 2020-06-18 | Открытое Акционерное Общество "Пеленг" | Способ эффективного кодирования и декодирования цифрового изображения |
CN109168032B (zh) * | 2018-11-12 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 视频数据的处理方法、终端、服务器及存储介质 |
US11216625B2 (en) | 2018-12-05 | 2022-01-04 | Vubiq Networks, Inc. | High bit density millimeter wave RFID systems, devices, and methods of use thereof |
KR102391615B1 (ko) * | 2020-03-16 | 2022-04-29 | 주식회사 카이 | 영상 처리 방법, 영상 재생 방법 및 그 장치들 |
CN112714323A (zh) * | 2020-12-25 | 2021-04-27 | 人和未来生物科技(长沙)有限公司 | 一种医学图像压缩方法及解码方法 |
CN113438444B (zh) * | 2021-03-25 | 2023-04-28 | 贵州电网有限责任公司 | 一种图片传输存储方法和系统 |
TWI834503B (zh) * | 2023-02-24 | 2024-03-01 | 財團法人工業技術研究院 | 用於選擇影像中的感興趣區域的電子裝置及方法 |
CN116781916B (zh) * | 2023-08-21 | 2023-11-17 | 北京中星微人工智能芯片技术有限公司 | 车辆图像存储方法、装置、电子设备和计算机可读介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4811210A (en) * | 1985-11-27 | 1989-03-07 | Texas Instruments Incorporated | A plurality of optical crossbar switches and exchange switches for parallel processor computer |
FR2660139B1 (fr) * | 1990-03-23 | 1995-08-25 | France Etat | Procede de codage et de transmission a au moins deux niveaux de qualite d'images numeriques appartenant a une sequence d'images, et dispositifs correspondants. |
US5805762A (en) * | 1993-01-13 | 1998-09-08 | Hitachi America, Ltd. | Video recording device compatible transmitter |
US5563960A (en) * | 1993-01-22 | 1996-10-08 | David Sarnoff Research Center, Inc. | Apparatus and method for emphasizing a selected region in the compressed representation of an image |
US5412741A (en) * | 1993-01-22 | 1995-05-02 | David Sarnoff Research Center, Inc. | Apparatus and method for compressing information |
US5586200A (en) * | 1994-01-07 | 1996-12-17 | Panasonic Technologies, Inc. | Segmentation based image compression system |
KR0171118B1 (ko) * | 1995-03-20 | 1999-03-20 | 배순훈 | 비디오신호 부호화 장치 |
US5748876A (en) * | 1995-12-29 | 1998-05-05 | Mci Communications Corporation | System and method for testing acoustic modems with semantically encoded waveforms |
-
1998
- 1998-03-20 KR KR1020007010414A patent/KR100550105B1/ko not_active IP Right Cessation
- 1998-03-20 WO PCT/US1998/003811 patent/WO1999049413A1/en not_active Application Discontinuation
- 1998-03-20 EP EP98910083A patent/EP1062625A4/en not_active Ceased
- 1998-03-20 JP JP2000538314A patent/JP3597780B2/ja not_active Expired - Lifetime
- 1998-03-20 AU AU64413/98A patent/AU6441398A/en not_active Abandoned
- 1998-03-20 CN CNB988139065A patent/CN1175373C/zh not_active Expired - Lifetime
- 1998-09-15 EP EP98948182A patent/EP1062623B1/en not_active Expired - Lifetime
- 1998-09-15 EP EP10179263A patent/EP2270717B1/en not_active Expired - Lifetime
- 1998-09-15 EP EP10179284A patent/EP2270718B1/en not_active Expired - Lifetime
- 1998-09-15 WO PCT/US1998/019065 patent/WO1999049412A1/en active IP Right Grant
- 1998-09-15 CN CNB988139057A patent/CN1231863C/zh not_active Expired - Lifetime
- 1998-09-15 DE DE69842222T patent/DE69842222D1/de not_active Expired - Lifetime
- 1998-09-15 EP EP06076577A patent/EP1732029B1/en not_active Expired - Lifetime
- 1998-09-15 DE DE69842100T patent/DE69842100D1/de not_active Expired - Lifetime
- 1998-09-15 AU AU94808/98A patent/AU9480898A/en not_active Abandoned
- 1998-09-15 EP EP10179243A patent/EP2270716B1/en not_active Expired - Lifetime
- 1998-09-15 KR KR1020007010415A patent/KR100657797B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP1062623A1 (en) | 2000-12-27 |
EP2270716A1 (en) | 2011-01-05 |
EP2270717B1 (en) | 2012-03-14 |
JP2002508607A (ja) | 2002-03-19 |
EP2270716B1 (en) | 2012-03-14 |
EP1062625A1 (en) | 2000-12-27 |
EP2270717A1 (en) | 2011-01-05 |
JP3597780B2 (ja) | 2004-12-08 |
KR100550105B1 (ko) | 2006-02-08 |
CN1175373C (zh) | 2004-11-10 |
KR100657797B1 (ko) | 2006-12-14 |
DE69842100D1 (de) | 2011-02-24 |
EP1062623A4 (en) | 2006-06-14 |
WO1999049412A1 (en) | 1999-09-30 |
WO1999049413A1 (en) | 1999-09-30 |
AU6441398A (en) | 1999-10-18 |
CN1291314A (zh) | 2001-04-11 |
EP2270718B1 (en) | 2012-12-26 |
EP1062625A4 (en) | 2005-08-31 |
EP1732029A1 (en) | 2006-12-13 |
DE69842222D1 (de) | 2011-05-26 |
AU9480898A (en) | 1999-10-18 |
EP2270718A1 (en) | 2011-01-05 |
KR20010042067A (ko) | 2001-05-25 |
CN1291315A (zh) | 2001-04-11 |
KR20010042066A (ko) | 2001-05-25 |
EP1062623B1 (en) | 2011-04-13 |
EP1732029B1 (en) | 2011-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1231863C (zh) | 用于进行图像压缩和解压缩的方法与装置 | |
CN1265617C (zh) | 图像处理装置、图像处理方法 | |
CN1161708C (zh) | 对基于子波编码方法产生的子波树进行编码的装置与方法 | |
CN1221927C (zh) | 图像处理装置和方法 | |
CN1274158C (zh) | 视频信息编码和解码方法、运动补偿视频编码器和相应的解码器 | |
CN1207897C (zh) | 图象处理方法和设备 | |
CN1211761C (zh) | 图像编码数据变换装置 | |
CN101069430A (zh) | 分级多视角图像编码和解码装置及方法 | |
CN1640141A (zh) | 用于复合文档压缩的编码器匹配层的分离和插值 | |
CN1135847C (zh) | 数据编码方法和设备 | |
CN1906945A (zh) | 用于可缩放视频编码和解码的方法和装置 | |
CN1947426A (zh) | 用于实现运动可伸缩性的方法和设备 | |
CN1153469C (zh) | 用于建立数据的子波分解的方法和装置 | |
CN1722831A (zh) | 对包括基本层的比特流预解码和解码的方法和设备 | |
CN1574970A (zh) | 使用图像残余预测编码/解码图像的方法和设备 | |
CN1461527A (zh) | 信号编码方法与装置以及信号解码方法与装置 | |
CN1783144A (zh) | 使用后向自适应规则进行整数数据的无损自适应Golomb/Rice编码和解码 | |
CN1843039A (zh) | 用于使用描述性模型参数来编码并解码增强层数据的系统和方法 | |
CN101049026A (zh) | 采用栅格运动估计和补偿的可扩展视频编码 | |
CN1599462A (zh) | 图像编码和解码装置及方法 | |
CN1906624A (zh) | 使用匹配追踪的数据压缩 | |
CN110383835A (zh) | 使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法 | |
CN1650628A (zh) | 用于支持mp4中的avc的方法和设备 | |
CN1190084C (zh) | 压缩视频信息的装置及其方法 | |
CN1381142A (zh) | 用于视频序列压缩的编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20051214 |