[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2317286T3 - Procedimiento y dispositivo para codificar y decodificar. - Google Patents

Procedimiento y dispositivo para codificar y decodificar. Download PDF

Info

Publication number
ES2317286T3
ES2317286T3 ES05776246T ES05776246T ES2317286T3 ES 2317286 T3 ES2317286 T3 ES 2317286T3 ES 05776246 T ES05776246 T ES 05776246T ES 05776246 T ES05776246 T ES 05776246T ES 2317286 T3 ES2317286 T3 ES 2317286T3
Authority
ES
Spain
Prior art keywords
cif
block
block structure
resolution
baselineskip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05776246T
Other languages
English (en)
Inventor
Peter Amon
Andreas Hutter
Benoit Timmermann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Application granted granted Critical
Publication of ES2317286T3 publication Critical patent/ES2317286T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Procedimiento para la codificación de video de secuencias de imágenes en el que las imágenes de la secuencia de imágenes se codifican escaladamente tal que los datos de vídeo que resultan contienen informaciones que aseguran una representación de las imágenes en múltiples escalones de resolución diferentes por cada imagen, viniendo definido el correspondiente escalón de resolución por la cantidad de los puntos de imagen por cada representación de imagen de las imágenes, realizándose la codificación basada en bloques y generándose una estructura de bloques que puede subdividir la imagen en el correspondiente escalón de resolución en bloques, bloques parciales y subbloques, describiendo esta subdivisión un eventual movimiento contenido en la secuencia de imágenes y subdividiéndose la estructura de bloques partiendo de un bloque en bloques parciales y en parte los bloques parciales (MB1_QCIF..MB4_QCIF,MB1_CIF..MB4_CIF,MB1_4CIF..MB4..4CI) en sucesivos subbloques de división más fina con las siguientes etapas: a) temporalmente se genera para un primer escalón de resolución una primera estructura de bloques (MV_QCIF; MV_CIF) y para un segundo escalón de resolución una segunda estructura de bloques (MV_CIF; MV_4CIF), presentando el primer escalón de resolución una cantidad de puntos de imagen inferior a la del segundo escalón de resolución, b) la segunda estructura de bloques (MV_CIF; MV_4CIF) se compara con la primera estructura de bloques (MV_QCIF; MV_CIF) tal que las diferencias en la subdivisión de las estructuras de bloques se detectan como diferencias de estructura, c) sobre la base de las características de las diferencias de estructura, se comprueba qué parte de la segunda estructura de bloques ha de tomarse en una segunda estructura de bloques modificada (MV''_CIF; MV''_4CIF) y la segunda estructura de bloques modificada se genera sobre la base de la comprobación, d) la segunda estructura de bloques modificada (MV''_CIF; MV''_4CIF) se toma como base para la codificación de la secuencia de imágenes.

Description

Procedimiento y dispositivo para codificar y decodificar.
La invención se refiere a un procedimiento para la codificación de video según el preámbulo de la reivindicación 1, un procedimiento para la decodificación según el concepto genérico de la reivindicación 14, así como codificador para la codificación de video según el concepto genérico de la reivindicación 15 y un dispositivo decodificador según el concepto genérico de la reivindicación 16.
Los datos de video digitales se comprimen por lo general para una memorización o transmisión, para reducir significativamente el enorme volumen de datos. La compresión se realiza entonces tanto eliminando la redundancia de señales contenida en los datos de video como también eliminando las partes de señal irrelevantes no perceptibles por el ojo humano. Esto se logra por lo general mediante un procedimiento de codificación híbrido, en el que la imagen a codificar primeramente se predice en el tiempo y el error de predicción que queda se transforma a continuación en la gama de frecuencias, por ejemplo mediante una transformación cosenoidal discreta y allí se cuantifica y se codifica mediante un código de longitud variable. La información de movimiento y los coeficientes espectrales cuantificados se transmiten finalmente.
Cuanto mejor sea esta predicción de la siguiente información de imagen a transmitir, tanto más pequeño será el error de predicción que quede tras la predicción y tanto más reducida será la velocidad de datos que tenga que emplearse a continuación para la codificación de este error. Una tarea esencial en la compresión de datos de video consiste por lo tanto en obtener una predicción lo más exacta posible de la imagen a codificar a partir de la información de imagen ya transmitida previamente.
La predicción de una imagen se realizó hasta ahora dividiendo la imagen primeramente por ejemplo en piezas regulares, típicamente bloques cuadrados del tamaño 8x8 ó 16x16 puntos de imagen, y realizándose a continuación para cada uno de estos bloques de imagen una predicción a partir de la información de imagen ya conocida en el receptor mediante compensación de movimientos. (Desde luego pueden resultar también bloques de diferente tamaño). Tal proceder puede deducirse de la figura 1. Entonces pueden diferenciarse dos casos básicos de predicción:
-
Predicción unidireccional: La compensación de movimientos se realiza aquí exclusivamente sobre la base de la imagen transmitida antes y da lugar a las llamadas "P-Frames" (estructuras P).
-
Predicción bidireccional: La predicción de la imagen se realiza mediante superposición de dos imágenes, de las cuales una es anterior en el tiempo y la otra es posterior en el tiempo y que da lugar a las llamadas "B-Frames" (estructuras B). Es de observar al respecto que ambas imágenes de referencia ya han sido transmitidas.
En función de estos dos casos posibles de predicción, resultan para filtrados compensados en movimiento en el tiempo ("Motion Compensated Temporal Filtering, MTCF") cinco modos de orientación en el procedimiento de MSRA [1], tal como se deduce de la figura 2.
La videocodificación escalable basada en MCTF se emplea para asegurar una buena calidad de video para una gama muy amplia de velocidades de bits. No obstante los algoritmos MCTF hoy conocidos muestran al respecto resultados inaceptables para velocidades de bits reducidas, lo cual es atribuible a que existe demasiado poca textura (informaciones de bloque) en relación con las informaciones que hacen referencia a las informaciones de movimiento (estructuras de bloque y vectores de movimiento) de un video definido por una secuencia de imágenes.
Por lo tanto, se necesita una forma escalable de información de movimiento para lograr una relación óptima entre textura y datos de movimiento para cada velocidad de bits y también resolución. Para ello se conoce por [1] una solución de MSRA (Microsoft Research Asia) que representa el estado actual de los algoritmos MCTF.
Allí propone la solución MSRA representar los movimientos por niveles, separándolos en sucesivas estructuras más finas. El procedimiento MSRA logra así que la calidad de las imágenes mejore en general para bajas velocidades de bits.
No obstante, esta solución tiene el inconveniente de que da lugar a algunos desplazamientos en la imagen reconstruida, que son atribuibles a un desplazamiento entre las informaciones de movimiento y la textura.
El documento ZHANG X Y COLAB. "Adaptive Quadtree Coding Of Motion-Compensated Image Sequences for Use on the Broadband ISDN" (Codificación adaptiva de árbol cuádruple de secuencias de imágenes compensadas en movimiento para su uso en la banda ancha ISDN), actas IEEE sobre circuitos y sistemas para la tecnología del video, vol. 3, núm. 3, 1 junio 1993 (ver al respecto en particular las páginas 222-223, párrafo II; FIGURAS 1-4) corresponde al estado más próximo de la técnica y describe un procedimiento escalable para la codificación de video basada en una representación Quadtree (de árbol cuádruple) escalable.
La tarea que sirve como base a la invención es indicar un procedimiento para codificar y decodificar, así como un codificador y decodificador que aseguren una codificación de video mejorada.
Esta tarea se resuelve partiendo del procedimiento para la codificación según el preámbulo de la reivindicación 1, mediante sus particularidades características.
Además, se resuelve esta tarea mediante un procedimiento para la decodificación según el concepto genérico de la reivindicación 14, el codificador según el concepto genérico de la reivindicación 15, así como el decodificador según el concepto genérico de la reivindicación 16, mediante sus particularidades.
Mediante este procedimiento se minimiza la diferencia entre informaciones de textura y además pueden codificarse estas informaciones con un coste mínimo. Además, desaparece el desplazamiento para los casos en los que se ha elegido el campo vectorial de movimiento más basto, con lo que queda asegurada una mejora de la calidad de la imagen incluso para bajas velocidades de bits, así como para bajas resoluciones.
Preferiblemente se captan para ello, para la detección de diferencias, los subbloques añadidos, captándose para la averiguación de diferencias alternativa o complementariamente las características de los subbloques.
Si se capta como característica de los subbloques el tamaño de bloque de los subbloques, se obtiene un indicador muy bueno en la práctica relativo al grado de precisión de las estructuras de bloque generadas.
Si se incluye para el cálculo de diferencias sólo aquel bloque parcial de la primera estructura de bloques que corresponde al bloque parcial de la segunda estructura de bloques, pueden reducirse aún más las diferencias de las informaciones de textura.
Aquí se incluyen preferiblemente sólo aquellos subbloques de la segunda estructura de bloques en la segunda estructura de bloques modificada cuyo tamaño de bloque alcanza un valor de umbral definido. De esta manera se logra que no tenga que transmitirse una estructura de bloques completa, es decir, un campo vectorial de movimiento completo, sino solamente la parte más significativa de la estructura. Esto da lugar por un lado a una reducción de la información a transmitir y además, pese a esta reducción, a una eliminación o bien reducción del desplazamiento relativo a la imagen codificada con artefactos. En la práctica es entonces especialmente ventajosa la utilización de un valor de umbral definible, ya que por ejemplo los valores óptimos obtenidos mediante simulación o ensayos experimentales pueden ajustarse aquí, pudiendo esperarse de ellos en base a los resultados de la simulación o bien experimentos resultados muy buenos.
Preferiblemente se define entonces el valor de umbral tal que el mismo indica una relación entre el tamaño de bloque de un subbloque de la segunda estructura de bloques y un tamaño de bloque contenido en una zona utilizada para comparación de la primera estructura de bloques que está asociada al subbloque más pequeño de la zona.
Además, se prevé en un perfeccionamiento señalar que los subbloques tomados pueden ser no diádicos.
Puede lograrse una mejora adicional de los resultados en cuanto a la representación de la imagen codificada cuando como primera estructura de bloques de un tercer escalón de resolución se utiliza la segunda estructura de bloques modificada del segundo escalón de resolución, presentando el segundo escalón de resolución una cantidad de puntos de imagen inferior al tercer escalón de resolución. Con ello se utilizan por lo tanto otras posibles estructuras de bloques para cada escalón más alto de resolución para generar la segunda estructura de bloques modificada, utilizándose en ellas la segunda estructura de bloques modificada del escalón de resolución precedente en cada caso para la comparación correspondiente a la invención.
También es ventajoso para una decodificación que la codificación se realice de tal manera que los subbloques no incluidos en la segunda estructura de bloques modificada se marquen en cada caso.
Para ello se prevé preferiblemente que la marcación se realice mediante la utilización de un modo de orientación denominado not_refind (no reencuentro).
La tarea que sirve de base a la invención se resuelve también mediante el procedimiento para decodificar una secuencia de imágenes codificada, generándose una representación escalada de las secuencias de imágenes teniendo en cuenta la segunda estructura de bloques modificada contenida en la secuencia de imágenes y generada según el procedimiento correspondiente a la invención para la codificación.
También contribuye a la solución de la tarea el codificador correspondiente a la invención, que presenta medios para realizar el procedimiento, así como el correspondiente decodificador, que presenta medios para decodificar una secuencia de imágenes codificadas según el procedimiento.
Otros detalles de la invención, así como ventajas, se describirán en base a las figuras 1 a 5 con referencia a un ejemplo de ejecución de la invención. Al respecto muestra:
figura 1 el modelo de una estimación del movimiento para generar información de movimiento escalable,
figura 2 los modos de orientación necesarios para ello,
figura 3 los tamaños de subbloques que se utilizan al respecto,
figura 4 la representación esquemática de estructuras de bloques generadas según la invención,
figura 5 la comparación de una imagen codificada según el procedimiento correspondiente a la invención con una imagen codificada según el estado de la técnica.
En la figura 1 se representa esquemáticamente la solución MSRA conocida por el estado de la técnica, que se describe para una mejor comprensión de la invención, ya que la misma se utiliza en el ejemplo de ejecución descrito al menos en partes.
Según MSRA se realiza la citada estimación de movimiento multinivel en cada nivel (layer) temporal. La estimación de movimiento se realiza entonces para una resolución espacial fija con diversos tamaños de macrobloque, para que el campo vectorial de movimiento que resulta se adapte a la resolución decodificada. Por ejemplo cuando el escalón de resolución original es un formato codificado en CIF y el escalón de resolución decodificado se realiza como formato QCIF, la estimación de movimiento se realiza sobre el plano de resolución del formato CIF o bien de la resolución CIF, realizándose esto con un tamaño de bloque de 32x32 como base y con un tamaño de macrobloque de 8x8 como tamaño de bloque mínimo. Cuando por el contrario el formato decodificado es un formato CIF, se escala el tamaño de los macrobloques en el factor 2 hacia abajo, tal como puede observarse en la figura 1.
Tal como puede observarse además en la figura 1, se transmiten en el ramal inferior del procesamiento allí representado para la decodificación del bloque existente en el formato QCIF los vectores de movimiento originales, mientras que para cada nivel más alto, por ejemplo aquél que sirve para decodificar el bloque CIF, solamente se utiliza la información diferencial respecto a los vectores de movimiento. Entonces puede servir un vector de movimiento individual de un nivel inferior para la predicción de varios vectores del nivel más alto cuando el bloque se fracciona en bloques parciales más pequeños.
Los distintos modos señalan entonces la dirección de la compensación del movimiento, tal como ya se ha indicado y se representa en la figura 2, mientras que en la figura 3 se observa que las estructuras de bloques se codifican según el procedimiento MSRA, por el mismo método que se utiliza en el estándar MPEG-4 AVC (Advanced Video Coding, codificación avanzada de video) [2].
Para elegir la estructura de bloques y la dirección de la compensación del movimiento, que han de codificarse, se prevé según los principios MSRA utilizar una llamada función de costes que se ha definido para esta función y que se conoce bajo el concepto "Rate Distortion Optimisation" (optimización de la tasa de distorsión).
En la representación multinivel del movimiento según MSRA, se generan diversas descripciones del movimiento que están adaptadas a las distintas resoluciones locales para el mismo nivel temporal (Frame Rate, frecuencia de reproducción de imágenes). Entonces se considera la estimación de movimiento que pertenece a las resoluciones más elevadas como información enriquecedora (enhancement layer/information), sobre la base de una detección de la información de movimiento basta. Puesto que el bloque de error residual generado por el campo de vector de movimiento basto contiene mucha energía, sólo se transmite aquel bloque de error residual que se genera tras la compensación de movimiento más precisa. Esto da lugar, sobre todo cuando se elige la información de movimiento más basta, a artefactos muy fuertes en la imagen de error residual reconstruida, teniendo lugar esto incluso con velocidades de bits altas.
En la figura 4 se representa cómo las estructuras de bloques temporales generadas según la invención dan lugar, utilizando el procedimiento correspondiente a la invención, a estructuras de bloques que en definitiva deben ser transmitidas.
Se observan tres estructuras de bloques temporales MV_QCIF, MV_CIF y MV_4CIF. Al respecto cada una de estas estructuras de bloques está asignada según la invención a un respectivo escalón de resolución, designándose bajo escalón de resolución el formato de la resolución con el que puede representarse una señal de video codificada según el procedimiento correspondiente a la invención que está compuesta por secuencias de imágenes.
Para el presente ejemplo de ejecución se trata entonces del Common Intermediate Format (CIF), formato intermedio común, el formato QCIF, así como el formato 4CIF.
QCIF es entonces un primer escalón de resolución, es decir, el escalón de resolución más bajo elegido para el procedimiento correspondiente a la invención, con lo que al mismo se le asigna en el marco de la invención también una primera estructura de bloques MV_QCIF, mientras que CIF es un segundo escalón de resolución, para el que se genera en el marco de la invención una segunda estructura de bloques MV_CIF.
La generación de la estructura de bloques se realiza entonces en el marco de un algoritmo de estimación del movimiento, por ejemplo utilizando el ya indicado procedimiento MCIF y/o MSRA.
Es de señalar por lo demás que las estructuras de bloques temporales MV_QCIF, MV_CIF y MV_4CIF presentan estructuras de subbloques que se afinan sucesivamente, que están caracterizadas porque partiendo en cada caso de bloques parciales definidos MB1_QCIF...MB4_QCIF de estructura de bloques temporal MV_QCIF, MV_CIF y MV_4CIF, se añaden otros subbloques que resultan cada vez más afinados.
Además, en la representación puede observarse que las estructuras temporales de bloques MV_QCIF, MV_CIF y MV_4CIF tienen la misma resolución local, y que esto permanece constante a pesar de que aumenta la cantidad de puntos de imagen al pasar de un escalón de resolución a otro escalón de resolución.
En la figura 4 pueden observarse por lo demás las estructuras de bloques MV'_QCIF, MV'_CIF y MV'_4CIF a transmitir o bien, en definitiva, por ejemplo para una aplicación streaming (utilizar antes de la descarga), transmitidas, que son generadas utilizando el procedimiento correspondiente a la invención a partir de las estructuras temporales de bloques MV_QCIF, MV_CIF y MV_4CIF comparando en cada caso una estructura de bloques perteneciente a un escalón de resolución elevado con una estructura de bloques perteneciente al siguiente escalón de resolución más bajo y generándose como resultado una estructura de bloques modificada perteneciente al escalón de resolución considerado, que presenta estructuras de subbloques que sólo contienen un subconjunto parcial de la estructura de bloques temporal perteneciente al mismo escalón de resolución, no tratándose aquí de un subconjunto auténtico que excluiría el caso de que la estructura de subbloques de la estructura de bloques modificada sea idéntica a la estructura de subbloques de la correspondiente estructura de bloques temporal, sino que más bien incluso también puede presentarse este caso especial según el procedimiento correspondiente a la invención, tratándose solamente de un subconjunto (sencillo) conocido por ejemplo por las matemáticas.
Este algoritmo correspondiente a la invención se describirá a continuación con algo más de detalle.
En el marco de la invención se comienza con la generación de una estructura de bloques perteneciente al escalón de resolución más bajo. A partir de esta primera estructura de bloques MV_QCIF resulta según la invención entonces directamente la estructura de bloques modificada MV'_QCIF, ya que para este caso, naturalmente, no puede realizarse ninguna comparación con una estructura de bloques precedente. La estructura de bloques modificada MV'_QCIF que entonces resulta tiene por tanto la misma estructura de subbloques que presenta la primera estructura de bloques MV_QCIF.
En el marco de la invención se genera en una etapa siguiente para el siguiente escalón de resolución más alto, en este caso CIF, una segunda estructura de bloques MV_CIF. Es de señalar al respecto que en la segunda estructura de bloques MV_CIF se han añadido otros subbloques, que dan lugar a una estructura de subbloques más fina, tal como presenta al respecto en comparación la primera estructura de bloques MV_QCIF. Los subbloques o bien estructuras de subbloques que se han añadido, se han representado en la figura con trazo de líneas y puntos.
Por lo tanto, en el marco de la invención se realiza en la siguiente etapa una comparación en la que los subbloques que se han añadido se comprueban en cuanto a sí presentan un tamaño de bloque que es más de cuatro veces más pequeño que el tamaño de bloque más pequeño de la correspondiente zona parcial de la primera estructura de
bloques.
Si esto es así, entonces se toma la correspondiente estructura de subbloques en una segunda estructura de bloques modificada MV'_CIF, mientras que en los casos en los que el subbloque a investigar presenta una precisión inferior, se renuncia a tomar la estructura de subbloques en la segunda estructura de bloques modificada a transmitir.
Para poder describir esto mejor, se han extraído en la figura 4 a modo de ejemplo dos de los subbloques contenidos en la segunda estructura de bloques MV_CIF, a saber, un primer subbloque SB1 y un segundo subbloque
SB2.
El primer subbloque SB1 se encuentra en un primer bloque parcial MB1_CIF de la segunda estructura de bloques MV_CIF. Correspondientemente se investiga en un primer bloque parcial MB1_QCIF de la primera estructura de bloques MV_QCIF correspondiente al primer bloque parcial MB1_CIF de la segunda estructura de bloques MV_CIF, cuál es el tamaño de subbloque más pequeño que aquí se presenta. En el presente ejemplo viene definido este tamaño de bloque mínimo por un primer subbloque mínimo MIN_SB1. Tal como puede observarse, corresponde el tamaño del primer subbloque al tamaño del primer subbloque mínimo, con lo que en este caso no hay ningún afinamiento. Correspondientemente no se toma según la invención en la segunda estructura de bloques MV_CIF a transmitir la estructura de subbloques que sirve de base al primer subbloque, con lo que en la representación de la figura 4 de la segunda estructura de bloques modificada MV_CIF falta la trama de punto y raya en el correspondiente
lugar.
Entre otros se incluye también un segundo subbloque SB2 para la comparación. Puesto que el segundo subbloque SB2 está incluido en un cuarto bloque parcial MB4_CIF de la segunda estructura de bloques MV_CIF, se busca correspondientemente en un cuarto subbloque MB4_QCIF de la primera estructura de bloques MV_QCIF un tamaño de bloque mínimo. Esto viene dado por un segundo subbloque mínimo MIN_SB2, que en este caso divide exactamente el cuarto bloque parcial MB4_QCIF de la primera estructura de bloques MV_QCIF. Tal como puede observarse, representa en este caso el tamaño del segundo subbloque SB2 la octava parte del tamaño del segundo subbloque mínimo MIN_SB2, con lo que incluso se da un afinamiento de ocho veces en comparación con la primera estructura de bloques MV_QCIF. Por lo tanto, en el marco de la invención se toma la estructura de subbloques que define el segundo subbloque también en la segunda estructura de bloques modificada MV'_CIF. Lo mismo sucede para todos aquellos bloques de la segunda estructura de bloques MV_CIF, tal como puede observarse en la representación según la figura 4 en las estructuras dibujadas con trazo discontinuo de la segunda estructura de bloques modificada
MV'_CIF.
Tal como muestra una comparación entre la segunda estructura de bloques MV_CIF y la segunda estructura de bloques modificada MV'_CIF, no se han tomado todas las estructuras de bloque de la segunda estructura de bloques MV'_CIF. Para que pueda representarse ahora correctamente una secuencia de imágenes codificada de esta manera, se añade en la codificación de las estructuras de bloques que deben ser transmitidas un distintivo de aquellos subbloques que no han sido incluidos en la estructura de bloques modificada. El procedimiento correspondiente a la invención encuentra también aplicación en otros escalones de resolución de la misma manera. Por ejemplo se genera según el presente ejemplo de ejecución para el formato 4CIF igualmente una estructura de bloques MV_4CIF. Según la invención, se utiliza la misma a continuación a su vez como una segunda estructura de bloques, mientras que la primera estructura de bloques viene dada por la precedente segunda estructura de bloques MV_CIF. La segunda estructura de bloques modificada MV'4CIF que resulta de la comparación entre ambas estructuras de bloques, se ha afinado entonces en la representación de la figura 4 a su vez sólo mediante una parte de las estructuras de subbloque añadidas que en la representación se han dibujado con trazo a puntos.
Alternativa o complementariamente puede utilizarse para la comparación, en lugar de una estructura de bloques temporal, una segunda estructura de bloques ya generada transmitida, es decir, modificada, como primera estructura de bloques.
Al respecto no es necesario en el marco de la invención generar para todos los escalones de resolución codificados en la secuencia de imágenes de estructuras de bloques a trasmitir según la invención, sino por ejemplo sólo en las resoluciones parciales de las citadas resoluciones, es decir, por ejemplo sólo para CIF en el caso de que se haya utilizado QCIF, CIF ó 4CIF o bien sólo para CIF en el caso de que se hayan utilizado QCIF y CIF. Más bien es suficiente en la práctica utilizar esto con escalones de resolución media en comparación con todos los escalones de resolución existentes, ya que para un nivel de resolución medio resulta la mejor performance (calidad), porque allí puede evitarse un Up and Down Sampling (muestreo hacia arriba y hacia abajo) de las estructuras de bloques y de los vectores de movimiento. Aquí se ajusta mediante un parámetro en cada caso la velocidad de datos para la información de movimiento para los distintos escalones de resolución locales, con lo que resulta en cada escalón de resolución una relación óptima entre la velocidad de datos para la información de movimientos y la información de textura.
La invención no queda limitada entonces al ejemplo de ejecución descrito en base a la figura 4, sino que incluye todas las realizaciones incluidas en el marco del conocimiento especializado que corresponden al núcleo correspondiente a la invención:
Esto es así en el campo vectorial de movimiento completo generado, en particular según MSRA (estructuras de bloques temporales MV_QCIF, MV_CIF y MV_4CIF), que está definido o bien existe por el lado del codificador, aún cuando no hayan de transmitirse completamente, sino más bien solamente la parte más significativa de este campo vectorial de movimiento.
Una ventaja esencial del algoritmo correspondiente a la invención es entonces la mejora de la calidad de la imagen también con bajas velocidades de bits, así como también para bajas resoluciones.
Esto puede observarse por ejemplo en ambas imágenes de la figura 5. La imagen representada en la parte izquierda muestra al respecto una imagen codificada según el formato CIF, que ha sido codificada a 15 Hz y 128 bps con un campo vectorial de movimiento completo conocido por el estado de la técnica, representándose en el lado derecho por el contrario una imagen codificada con el mismo formato y la misma velocidad de bits, que no obstante en comparación con la imagen precedente ha sido decodificada generada con los métodos de afinamiento correspondientes a la invención.
Una comparación entre ambas imágenes da como resultado que la imagen codificada según la invención presenta claramente menos artefactos (de codificación).
Estos artefactos se han reducido fuertemente por lo tanto gracias al procedimiento correspondiente a la invención, ya que básicamente se limita así el desplazamiento entre la información de movimiento y la textura, afinándose según la invención precisamente sólo aquella parte del segundo campo vectorial de movimiento que difiere más fuertemente o muy fuertemente del campo vectorial de movimiento basto.
Este proceder debe comunicarse naturalmente a un decodificador que decodifica los datos. Para ello se prevé según el algoritmo correspondiente a la invención introducir un nuevo modo de orientación que podría denominarse por ejemplo "not_refind" (no reencuentro). Cuando ahora el decodificador decodifica este modo de orientación, sabe el decodificador que han de utilizarse los vectores de movimiento y la estructura de bloques que corresponden al nivel de estimación del movimiento precedente, es decir, por ejemplo el correspondiente al procedimiento MSRA. Por lo tanto, en un caso así no se utiliza un afinamiento adicional de los vectores de movimiento.
Bibliografía
[1] Jizheng Xu, Ruiqin Xiong, Bo Feng, Gary Sullivan, Ming-Chieh Lee, Feng Wu, Shipeng Li, "3D subband video coding using Barbell lifting" (codificación de vídeo en subbanda 3D utilizando elevación Barbell'', ISO/IEC JTC1/SC29/WG11 MPEG, Encuentro 68º, M10569/s05, Munich, marzo 2004.
[2] ITU-T e ISO/IEC JTC1, "Advanced Video Coding for Generic Audiovisual Services" (codificación avanzada de vídeo para servicios audiovisuales genéricos'', Recomendación ITU-T H.264 - ISO/IEC 14496-10 AVC, 2003.

Claims (16)

1. Procedimiento para la codificación de video de secuencias de imágenes en el que las imágenes de la secuencia de imágenes se codifican escaladamente tal que los datos de vídeo que resultan contienen informaciones que aseguran una representación de las imágenes en múltiples escalones de resolución diferentes por cada imagen, viniendo definido el correspondiente escalón de resolución por la cantidad de los puntos de imagen por cada representación de imagen de las imágenes, realizándose la codificación basada en bloques y generándose una estructura de bloques que puede subdividir la imagen en el correspondiente escalón de resolución en bloques, bloques parciales y subbloques, describiendo esta subdivisión un eventual movimiento contenido en la secuencia de imágenes y subdividiéndose la estructura de bloques partiendo de un bloque en bloques parciales y en parte los bloques parciales (MB1_QCIF..MB4_QCIF,MB1_CIF..MB4_CIF,MB1_4CIF..MB4..4CI) en sucesivos subbloques de división más fina con las siguientes etapas:
a)
temporalmente se genera para un primer escalón de resolución una primera estructura de bloques (MV_QCIF; MV_CIF) y para un segundo escalón de resolución una segunda estructura de bloques (MV_CIF; MV_4CIF), presentando el primer escalón de resolución una cantidad de puntos de imagen inferior a la del segundo escalón de resolución,
b)
la segunda estructura de bloques (MV_CIF; MV_4CIF) se compara con la primera estructura de bloques (MV_QCIF; MV_CIF) tal que las diferencias en la subdivisión de las estructuras de bloques se detectan como diferencias de estructura,
c)
sobre la base de las características de las diferencias de estructura, se comprueba qué parte de la segunda estructura de bloques ha de tomarse en una segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) y la segunda estructura de bloques modificada se genera sobre la base de la comprobación,
d)
la segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) se toma como base para la codificación de la secuencia de imágenes.
\vskip1.000000\baselineskip
2. Procedimiento según la reivindicación 1,
caracterizado porque para detectar las diferencias se captan subbloques añadidos.
\vskip1.000000\baselineskip
3. Procedimiento según la reivindicación 1 ó 2,
caracterizado porque para la detección de diferencias se captan características de los subbloques.
\vskip1.000000\baselineskip
4. Procedimiento según la reivindicación 3,
caracterizado porque como característica de los subbloques se capta el tamaño de bloque de los subbloques.
\vskip1.000000\baselineskip
5. Procedimiento según una de las reivindicaciones precedentes,
caracterizado porque para la detección de las diferencias sólo se incluye el bloque parcial (MB1_QCIF..
MB4_QCIF; MB1_CIF..MB4_CIF) de la primera estructura de bloques (MV_QCIF; MV_CIF) que corresponde al bloque parcial (MB1_CIF..MB4 CIF; MB1_4CIF..MB4_4CIF) de la segunda estructura de bloques (MV_CIF; MV4_CIF).
\vskip1.000000\baselineskip
6. Procedimiento según una de las reivindicaciones precedentes,
caracterizado porque la generación de la segunda estructura de bloques modificada se realiza sobre la base de una decisión de valor límite.
\vskip1.000000\baselineskip
7. Procedimiento según una de las reivindicaciones 3 a 6,
caracterizado porque sólo se toman aquellos subbloques de la segunda estructura de bloques (MV_CIF;
MV_4CIF) en la segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) cuyo tamaño de bloque alcanza un valor de umbral definible.
\newpage
8. Procedimiento según la reivindicación 7,
caracterizado porque el valor de umbral se define tal que el mismo indica una relación entre el tamaño de bloques de un subbloque de la segunda estructura de bloques (MV_CIF; MV_4CIF) y un tamaño de bloque incluido en una zona incluida a efectos comparativos de la primera estructura de bloques (MV_QCIF; MV_CIF) que está asignada al subbloque más pequeño de la zona.
\vskip1.000000\baselineskip
9. Procedimiento según una de las reivindicaciones precedentes,
caracterizado porque los subbloques tomados pueden no estar divididos diádicamente.
\vskip1.000000\baselineskip
10. Procedimiento según una de las reivindicaciones precedentes,
caracterizado porque como primera estructura de bloques (MV_CIF) de un tercer escalón de resolución, se utiliza la segunda estructura de bloques modificada (MV'_4CIF) del segundo escalón de resolución, presentando el segundo escalón de resolución una cantidad de puntos de imagen inferior a la del tercer escalón de resolución.
\vskip1.000000\baselineskip
11. Procedimiento según una de las reivindicaciones 7 a 10,
caracterizado porque la codificación se realiza tal que en la segunda estructura de bloques modificada (MV_CIF; MV_4CIF) se marcan en cada caso subbloques no tomados.
\vskip1.000000\baselineskip
12. Procedimiento según una de las reivindicaciones 9 a 11,
caracterizado porque la codificación se realiza de tal manera que se marcan en cada caso subbloques divididos no diádicamente.
\vskip1.000000\baselineskip
13. Procedimiento según la reivindicación precedente,
caracterizado porque la marcación se realiza utilizando un modo de orientación designado.
\vskip1.000000\baselineskip
14. Procedimiento para decodificar una secuencia de imágenes codificada,
caracterizado porque teniendo en cuenta las segundas estructuras de bloques modificadas generadas según un procedimiento correspondiente a una de las reivindicaciones precedentes, contenidas en la secuencia de imágenes, se genera una representación escalada de la secuencia de imágenes.
\vskip1.000000\baselineskip
15. Codificador para generar una secuencia de imágenes codificada,
caracterizado por medios para realizar el procedimiento según una de las reivindicaciones 1 a 13.
\vskip1.000000\baselineskip
16. Decodificador caracterizado por medios para decodificar una secuencia de bits codificada generada según el procedimiento correspondiente a una de las reivindicaciones 1 a 13.
ES05776246T 2004-08-05 2005-07-27 Procedimiento y dispositivo para codificar y decodificar. Active ES2317286T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004038110A DE102004038110B3 (de) 2004-08-05 2004-08-05 Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
DE102004038110 2004-08-05

Publications (1)

Publication Number Publication Date
ES2317286T3 true ES2317286T3 (es) 2009-04-16

Family

ID=35116126

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05776246T Active ES2317286T3 (es) 2004-08-05 2005-07-27 Procedimiento y dispositivo para codificar y decodificar.

Country Status (8)

Country Link
US (1) US8428140B2 (es)
EP (1) EP1774790B1 (es)
KR (1) KR101217050B1 (es)
CN (1) CN101002476B (es)
AT (1) ATE418843T1 (es)
DE (2) DE102004038110B3 (es)
ES (1) ES2317286T3 (es)
WO (1) WO2006015947A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004041664A1 (de) 2004-08-27 2006-03-09 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
JP4646146B2 (ja) * 2006-11-30 2011-03-09 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
JP4826546B2 (ja) * 2007-06-18 2011-11-30 ソニー株式会社 画像処理装置、画像処理方法、及びプログラム
PL2993904T3 (pl) 2009-10-01 2017-09-29 Sk Telecom Co., Ltd. Sposób i urządzenie do kodowania/dekodowania obrazu za pomocą warstwy rozdziału
CN102361458B (zh) * 2011-08-16 2013-09-04 北京首钢自动化信息技术有限公司 一种在快速数据管理系统实现高效数据压缩的方法
CN102413035B (zh) * 2011-08-16 2013-11-20 北京首钢自动化信息技术有限公司 一种实现快速数据采集的方法
US20130286227A1 (en) * 2012-04-30 2013-10-31 T-Mobile Usa, Inc. Data Transfer Reduction During Video Broadcasts
JP6080405B2 (ja) * 2012-06-29 2017-02-15 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
ITTO20130032A1 (it) * 2013-01-15 2014-07-16 St Microelectronics Srl Procedimento ed apparecchiatura per calcolare piramidi di immagini e prodotto informatico relativo
US9496894B1 (en) * 2015-10-21 2016-11-15 GE Lighting Solutions, LLC System and method for data compression over a communication network

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
US5414469A (en) * 1991-10-31 1995-05-09 International Business Machines Corporation Motion video compression system with multiresolution features
US5253058A (en) * 1992-04-01 1993-10-12 Bell Communications Research, Inc. Efficient coding scheme for multilevel video transmission
JPH0730896A (ja) * 1993-06-25 1995-01-31 Matsushita Electric Ind Co Ltd 動きベクトル符号化及び復号化方法
US5486863A (en) * 1994-04-29 1996-01-23 Motorola, Inc. Method for determining whether to intra code a video block
US6084908A (en) * 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
JP3210862B2 (ja) * 1996-06-27 2001-09-25 シャープ株式会社 画像符号化装置及び画像復号装置
US6614845B1 (en) * 1996-12-24 2003-09-02 Verizon Laboratories Inc. Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems
US6728775B1 (en) * 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
CN1156171C (zh) * 1997-04-07 2004-06-30 松下电器产业株式会社 提高处理效率的图象声音处理装置
JP3844844B2 (ja) * 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
US6115070A (en) * 1997-06-12 2000-09-05 International Business Machines Corporation System and method for DCT domain inverse motion compensation using shared information
KR100226722B1 (ko) * 1997-07-30 1999-10-15 구자홍 동영상 움직임 벡터 추정 방법
EP1788815A3 (en) * 1997-11-05 2008-10-15 Sony Corporation Rate control for video transcoding with resolution conversion
US6937659B1 (en) * 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
US6560280B1 (en) * 1998-02-02 2003-05-06 Vcon Ltd. Video transmission system
US6343098B1 (en) * 1998-02-26 2002-01-29 Lucent Technologies Inc. Efficient rate control for multi-resolution video encoding
US6574274B2 (en) * 1998-02-27 2003-06-03 Sony Corporation Picture signal processing system, decoder, picture signal processing method, and decoding method
US6192079B1 (en) * 1998-05-07 2001-02-20 Intel Corporation Method and apparatus for increasing video frame rate
US6310919B1 (en) * 1998-05-07 2001-10-30 Sarnoff Corporation Method and apparatus for adaptively scaling motion vector information in an information stream decoder
AU4701999A (en) * 1998-06-19 2000-01-05 Equator Technologies, Inc. Decoding an encoded image having a first resolution directly into a decoded image having a second resolution
US6421466B1 (en) * 1999-09-29 2002-07-16 Neomagic Corp. Hierarchical motion estimation with levels of varying bit width for digital video compression
US6671320B1 (en) * 2000-06-16 2003-12-30 Lucent Technologies Inc. CIF to QCIF video bitstream down conversion
US6614442B1 (en) * 2000-06-26 2003-09-02 S3 Graphics Co., Ltd. Macroblock tiling format for motion compensation
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
US6944226B1 (en) * 2000-10-03 2005-09-13 Matsushita Electric Corporation Of America System and associated method for transcoding discrete cosine transform coded signals
KR100783396B1 (ko) * 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
US20050207663A1 (en) * 2001-07-31 2005-09-22 Weimin Zeng Searching method and system for best matching motion vector
EP1294194B8 (en) * 2001-09-10 2010-08-04 Texas Instruments Incorporated Apparatus and method for motion vector estimation
EP2096871B1 (en) * 2001-09-14 2014-11-12 NTT DoCoMo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
JP3874179B2 (ja) * 2002-03-14 2007-01-31 Kddi株式会社 符号化動画像変換装置
JP4611640B2 (ja) * 2002-03-15 2011-01-12 ノキア コーポレイション ビデオシーケンス内の動きを符号化する方法
AU2003242037A1 (en) * 2002-07-02 2004-01-23 Matsushita Electric Industrial Co., Ltd. Image encoding method and image decoding method
US7020201B2 (en) * 2002-11-20 2006-03-28 National Chiao Tung University Method and apparatus for motion estimation with all binary representation
KR20040046892A (ko) 2002-11-28 2004-06-05 엘지전자 주식회사 움직임 벡터 예측 부호화 및 복호화 방법
JP4536325B2 (ja) * 2003-02-04 2010-09-01 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
US7471725B2 (en) * 2003-03-26 2008-12-30 Lsi Corporation Segmented motion estimation with no search for small block sizes
KR100510136B1 (ko) * 2003-04-28 2005-08-26 삼성전자주식회사 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치
US20040258154A1 (en) * 2003-06-19 2004-12-23 Microsoft Corporation System and method for multi-stage predictive motion estimation
US7400317B2 (en) * 2003-08-29 2008-07-15 Avago Technologies Ecbu Ip Pte Ltd Finger navigation system using captive surface
US20050047504A1 (en) * 2003-09-03 2005-03-03 Sung Chih-Ta Star Data stream encoding method and apparatus for digital video compression
US7330509B2 (en) * 2003-09-12 2008-02-12 International Business Machines Corporation Method for video transcoding with adaptive frame rate control
US7203237B2 (en) * 2003-09-17 2007-04-10 Texas Instruments Incorporated Transcoders and methods
US7324595B2 (en) * 2003-09-22 2008-01-29 Lsi Logic Corporation Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction
US7346111B2 (en) * 2003-12-10 2008-03-18 Lsi Logic Corporation Co-located motion vector storage
KR20050061762A (ko) * 2003-12-18 2005-06-23 학교법인 대양학원 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치
KR100596705B1 (ko) * 2004-03-04 2006-07-04 삼성전자주식회사 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템
US20060002474A1 (en) * 2004-06-26 2006-01-05 Oscar Chi-Lim Au Efficient multi-block motion estimation for video compression
US20060146933A1 (en) * 2004-12-30 2006-07-06 Paul Lu Method and system for video motion processing in a microprocessor

Also Published As

Publication number Publication date
ATE418843T1 (de) 2009-01-15
CN101002476A (zh) 2007-07-18
CN101002476B (zh) 2011-06-08
WO2006015947A1 (de) 2006-02-16
KR20070046825A (ko) 2007-05-03
EP1774790A1 (de) 2007-04-18
EP1774790B1 (de) 2008-12-24
KR101217050B1 (ko) 2012-12-31
DE102004038110B3 (de) 2005-12-29
DE502005006339D1 (de) 2009-02-05
US8428140B2 (en) 2013-04-23
US20080292002A1 (en) 2008-11-27

Similar Documents

Publication Publication Date Title
JP6648315B2 (ja) 量子化ブロック逆量子化方法
KR101947142B1 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
KR101292091B1 (ko) 적응적 화면내 예측 부호화 및 복호화 방법
KR101596829B1 (ko) 비디오 신호의 디코딩 방법 및 장치
ES2700623T3 (es) Aparato para decodificar una imagen
KR101483750B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
US20100239002A1 (en) Method and an apparatus for processing a video signal
EP1811785A2 (en) Method and apparatus for video encoding/decoding based on orthogonal transform and vector quantization
BR122015015910A2 (pt) métodos e aparelho para transformar a seleção em codificação e decodificação de vídeo
BR112013016043B1 (pt) Método de decodificação de vídeo e decodificador de vídeo para prediçãode valores de pixel de pixels alvo em um bloco alvo sob um modo plano
KR102011491B1 (ko) 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
TW202205860A (zh) 在合併模式中對視頻資料解碼的方法、在合併模式中對視頻資料編碼的方法及儲存編碼視頻資訊的非暫態電腦可讀取媒體
KR20190052097A (ko) 영상 처리 방법 및 이를 위한 장치
EP4258658A1 (en) Prediction method, encoder, decoder and storage medium
WO2012081162A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US20110243227A1 (en) Moving picture decoding method and device, and moving picture encoding method and device
JP2011172297A (ja) 符号化および復号のための方法および装置
KR20070074453A (ko) 영상 신호의 인코딩 및 디코딩 방법
ES2317286T3 (es) Procedimiento y dispositivo para codificar y decodificar.
CN101409830B (zh) Dct系数块相似性判断、图像加解密方法及装置
KR101529903B1 (ko) 블록기반 깊이정보 맵의 코딩 방법과 장치, 및 이를 이용한 3차원 비디오 코딩 방법
KR102242723B1 (ko) 비디오 신호의 디코딩 방법 및 장치
CN104506860A (zh) 视频编码的参考图像选择方法及系统
JP2011223316A (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2011223315A (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法