ES2964540T3 - Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes - Google Patents
Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes Download PDFInfo
- Publication number
- ES2964540T3 ES2964540T3 ES19184092T ES19184092T ES2964540T3 ES 2964540 T3 ES2964540 T3 ES 2964540T3 ES 19184092 T ES19184092 T ES 19184092T ES 19184092 T ES19184092 T ES 19184092T ES 2964540 T3 ES2964540 T3 ES 2964540T3
- Authority
- ES
- Spain
- Prior art keywords
- prediction
- signal
- region
- partition
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 108
- 238000005192 partition Methods 0.000 claims abstract description 80
- 230000033001 locomotion Effects 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 27
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims 2
- 230000015654 memory Effects 0.000 description 36
- 230000008569 process Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
- H04N19/543—Motion estimation other than block-based using regions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Color Television Systems (AREA)
Abstract
Un dispositivo de codificación predictiva de imágenes puede codificar eficientemente una imagen, al mismo tiempo que suprime un aumento en la información de predicción y reduce el error de predicción de un bloque objetivo. En un dispositivo de codificación predictiva de imágenes según una realización, para producir una señal de predicción de una partición en una región objetivo, se decide si se puede utilizar información de predicción de una región vecina. Cuando se puede utilizar información de predicción de la región vecina, se determina una anchura de región de la partición donde se utiliza la información de predicción de la región vecina para producir la señal de predicción. La señal de predicción de la región objetivo se produce a partir de una señal reconstruida basada en la información de predicción de la región objetivo, la información de predicción de la región vecina y el ancho de la región. Se codifican la información de predicción, la información que identifica el ancho de la región y una señal residual entre la señal de predicción y una señal original de la región objetivo. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenesCampo técnico
La presente invención se refiere a un dispositivo de codificación predictiva de imágenes, a un procedimiento de codificación predictiva de imágenes, a un programa de codificación predictiva de imágenes, a un dispositivo de descodificación predictiva de imágenes, a un procedimiento de descodificación predictiva de imágenes y a un programa de descodificación predictiva de imágenes. Más específicamente, la presente invención se refiere a un dispositivo de codificación predictiva de imágenes, a un procedimiento de codificación predictiva de imágenes, a un programa de codificación predictiva de imágenes, a un dispositivo de descodificación predictiva de imágenes, a un procedimiento de descodificación predictiva de imágenes y a un programa de descodificación predictiva de imágenes que realizan la codificación predictiva y la descodificación predictiva usando división de regiones.
Técnica anterior
La tecnología de codificación por compresión se usa con el fin de transmitir y almacenar de manera eficaz datos de imágenes fijas y datos de imágenes en movimiento. Los sistemas de MPEG-1 a 4 y de la recomendación H.261 a la recomendación H.264 de la ITU (Unión Internacional de Telecomunicaciones) se usan ampliamente para un sistema de codificación por compresión para imágenes en movimiento.
En tales sistemas de codificación, el procesamiento de codificación y el procesamiento de descodificación se realizan después de dividir una imagen, que sirve como objetivo de codificación, en una pluralidad de bloques. En la codificación de predicción intra-imagen, se produce una señal de predicción de un bloque de destino usando una señal de imagen reconstruida adyacente dentro de la misma imagen en la que está incluido el bloque de destino. La señal de imagen reconstruida se genera restaurando los datos de imagen comprimidos. A continuación, en la codificación por predicción intra-imagen, se genera una señal diferencial restando la señal de predicción a una señal del bloque de destino, y se codifica la señal diferencial. En la codificación de predicción inter-imagen, que hace referencia a la señal de imagen reconstruida dentro de una imagen diferente a la imagen en la que está incluido el bloque de destino, se realiza una compensación de movimiento y, de este modo, se produce una señal de predicción. A continuación, en la codificación por predicción inter-imagen, la señal de predicción se resta a la señal del bloque de destino, para producir una señal diferencial, y se codifica la señal diferencial.
Por ejemplo, la codificación por predicción intra-imagen de la recomendación H.264 adopta un procedimiento en el que la señal de predicción se produce mediante la extrapolación, en una dirección predeterminada, de los valores de píxeles reconstruidos (señales reconstruidas) de píxeles ubicados de manera adyacente a un bloque que sirve como objetivo de codificación. La figura 20 es una vista esquemática que describe el procedimiento de predicción intraimagen usado en la recomendación H.264 de la ITU. La figura 20(A) muestra el procedimiento de predicción intraimagen en el que se realiza extrapolación en una dirección vertical. En la figura 20(A), un bloque de destino de píxeles 802 de tamaño 4 x 4 es el bloque de destino que sirve como objetivo de codificación. Un grupo de píxeles 801 compuesto por los píxeles A a M, ubicados de manera adyacente a un límite del bloque de destino 802, es una región adyacente, y es una señal de imagen que se ha reconstruido en el proceso anterior. En la predicción mostrada en la figura 20(A), los valores de píxel de los píxeles adyacentes A a D, ubicados directamente por encima del bloque de destino 802, se extrapolan hacia abajo para producir una señal de predicción.
La figura 20(B) muestra un procedimiento de predicción intra-imagen en el que se realiza extrapolación en una dirección horizontal. En la predicción mostrada en la figura 20(B), se produce una señal de predicción mediante la extrapolación de valores de píxel de los píxeles reconstruidos I a L, ubicados a la izquierda del bloque de destino 802, hacia la derecha.
En el procedimiento de predicción intra-imagen, la señal de predicción que tiene la mínima diferencia con respecto a la señal original del bloque de destino se toma como la señal de predicción óptima, entre las nueve señales de predicción producidas por los procedimientos mostrados en (A) - (I) de la figura 20. Procedimientos específicos para producir la señal de predicción de esta manera se describen, por ejemplo, en la bibliografía de patente 1.
En la codificación habitual por predicción inter-imagen, se produce una señal de predicción buscando una señal que se asemeje a la señal original del bloque que sirve como objetivo de codificación, a partir de imágenes reconstruidas. En la codificación por predicción inter-imagen, se codifican un vector de movimiento y una señal residual entre la señal original y la señal de predicción del bloque de destino. El vector de movimiento es un vector que indica una magnitud de desplazamiento espacial entre el bloque de destino y una región en la que se ubica la señal buscada. La técnica de buscar el vector de movimiento para cada bloque, de esta manera, se denomina correlación de bloques.
La figura 21 es una vista esquemática que describe la correlación de bloques. En la figura 21, se muestra una imagen reconstruida 903 en (a) y se muestra una imagen 901, que incluye un bloque de destino 902, en (b). En este caso, una región 904 en la imagen 903 es una región que está en la misma posición espacial que el bloque de destino 902. En la correlación de bloques, se establece un intervalo de búsqueda 905 que rodea a la región 904, y se detecta, a partir del intervalo de búsqueda, una región 906 que tiene la mínima suma de diferencias absolutas con respecto a la señal original del bloque de destino 902. La señal de la región 906 se vuelve una señal de predicción, y se detecta un vector, que indica la magnitud del desplazamiento desde la región 904 hasta la región 906, como vector de movimiento 907.
En la correlación de bloques, también existe un procedimiento en el que se preparan una pluralidad de imágenes de referencia 903, y se selecciona, para cada bloque de destino, la imagen de referencia para realizar la correlación de bloques, y se detecta información de selección de imagen de referencia. En la recomendación H.264, con el fin de asimilar cambios de características locales en las imágenes, se preparan una pluralidad de tipos de predicción con diferentes tamaños de bloques para codificar el vector de movimiento. Los tipos de predicción de la recomendación H.264 se describen en la bibliografía de patente 2, por ejemplo.
En la codificación por compresión de datos de imágenes en movimiento, cada imagen (trama o campo) puede codificarse en cualquier secuencia. Por tanto, existen tres enfoques para un orden de codificación en la predicción inter-imagen que produce una señal de predicción con referencia a imágenes reconstruidas. El primer enfoque es una predicción hacia delante que produce una señal de predicción con referencia a imágenes reconstruidas en el pasado, en un orden de visualización. El segundo enfoque es una predicción hacia atrás que produce una señal de predicción con referencia a imágenes reconstruidas en el futuro, en un orden de visualización. El tercer enfoque es una predicción bidireccional que realiza tanto la predicción hacia delante como la predicción hacia atrás para promediar las dos señales de predicción. Estos tipos de predicción inter-imagen se describen en la bibliografía de patente 3, por ejemplo.
Lista de citas
Bibliografía de patentes
Bibliografía de patente 1: Patente estadounidense n° 6765964
Bibliografía de patente 2: Patente estadounidense n° 7003035
Bibliografía de patente 3: Patente estadounidense n° 6259739
Sumario de la Invención
Problema técnico
Tal como se ha descrito anteriormente, la producción de la señal de predicción se realiza para cada unidad de bloque. Sin embargo, dado que la ubicación y el movimiento de un objeto en movimiento puede establecerse arbitrariamente en un vídeo, cuando la imagen está dividida en bloques a intervalos iguales, existen casos en los que dos o más regiones con diferentes movimientos y patrones están incluidas en el bloque. En un caso de este tipo, la codificación por predicción de la película produce un gran error de predicción cerca del borde del objeto. Tal como se ha descrito anteriormente, en la recomendación H.264, con el fin de asimilar cambios de características locales en las imágenes y suprimir un aumento en el error de predicción, se preparan una pluralidad de tipos de predicción con diferentes tamaños de bloques. Sin embargo, a medida que el tamaño de bloque se hace más pequeño, es necesaria información adicional, requerida para producir la señal de predicción (vector de movimiento, etc.) para cada bloque pequeño, dando como resultado un aumento en la cantidad de código de la información adicional. Adicionalmente, cuando se preparan muchos tamaños de bloques, es necesaria información de modalidad para seleccionar el tamaño de bloque, dando como resultado también un aumento en la cantidad de código de la información de modalidad.
En vista de esos problemas, un aspecto de la presente invención tiene como objetivo proporcionar un dispositivo de codificación predictiva de imágenes, un procedimiento de codificación predictiva de imágenes y un programa de codificación predictiva de imágenes que puedan codificar de manera eficaz una imagen, suprimiendo a la vez el aumento en la información de predicción, tal como la información adicional (vectores de movimiento, etc.) y la información de modalidad, y reduciendo el error de predicción del bloque de destino. Adicionalmente, otro aspecto de la presente invención tiene como objetivo proporcionar un dispositivo de descodificación predictiva de imágenes, un procedimiento de descodificación predictiva de imágenes y un programa de descodificación predictiva de imágenes, que se corresponden con dicho aspecto de codificación. En el documento US 2005/013498 A1 se describen técnicas y herramientas para codificar y descodificar información de vector de movimiento para imágenes de vídeo. Un codificador de vídeo produce un código de vector de movimiento extendido codificando conjuntamente, para un conjunto de píxeles, un código de conmutación, información de vector de movimiento y un símbolo terminal que indica si se codifican datos posteriores para el conjunto de píxeles. En otro aspecto, un codificador/descodificador selecciona predictores de vector de movimiento, para macrobloques. Un codificador/descodificador de vídeo usa predicción de vector de movimiento híbrida. En otro aspecto, un codificador/descodificador de vídeo señala un modo de vector de movimiento para una imagen predicha. Un descodificador de vídeo descodifica un conjunto de píxeles recibiendo un código de vector de movimiento extendido, que refleja la codificación conjunta de información de movimiento junto con información de intra-/inter-codificación y un símbolo terminal. El descodificador determina si existen datos posteriores para el conjunto de píxeles basándose, por ejemplo, en el símbolo terminal.
Solución al problema
Un aspecto de la presente invención proporciona un método de descodificación predictiva de imágenes para un dispositivo de descodificación predictiva de imágenes como se define en la reivindicación 1. Otro aspecto de la presente invención proporciona un dispositivo de descodificación predictiva de imágenes como se define en la reivindicación 2.
Efectos ventajosos de la invención
Tal como se ha descrito anteriormente, según la presente invención, se proporcionan un dispositivo de codificación predictiva de imágenes, un procedimiento de codificación predictiva de imágenes y un programa de codificación predictiva de imágenes que puedan codificar de manera eficaz una imagen suprimiendo un aumento en la información de predicción y reduciendo el error de predicción de un bloque de destino. Adicionalmente, según la presente invención, se proporcionan de manera correspondiente un dispositivo de descodificación predictiva de imágenes, un procedimiento de descodificación predictiva de imágenes y un programa de descodificación predictiva de imágenes.
Breve descripción de los dibujos
La figura 1 es un diagrama que muestra un dispositivo de codificación predictiva de imágenes según una realización; la figura 2 es un diagrama que ilustra una partición en un bloque de destino en el que se produce una señal de predicción, usando información de predicción de un bloque adyacente;
la figura 3 es un diagrama de flujo que muestra procedimientos de un procedimiento de codificación predictiva de imágenes según una realización;
la figura 4 es un diagrama de flujo detallado de la etapa 108 en la figura 3;
la figura 5 es un diagrama de flujo detallado de la etapa 202 en la figura 4;
la figura 6 es un diagrama de flujo detallado de la etapa 110 en la figura 3;
la figura 7 es un diagrama que muestra un dispositivo de descodificación predictiva de imágenes según una realización;
la figura 8 es un diagrama de flujo de un procedimiento de descodificación predictiva de imágenes según una realización;
la figura 9 es un diagrama de flujo detallado de la etapa S508 en la figura 8;
la figura 10 es un diagrama que ilustra otro ejemplo del bloque adyacente;
la figura 11 es un diagrama de flujo que muestra procedimientos detallados de otro ejemplo de la etapa S108 en la figura 3;
la figura 12 es un diagrama de flujo que muestra procedimientos detallados de otro ejemplo de la etapa S508 en la figura 8;
la figura 13 es un diagrama que ilustra otro ejemplo de la partición en el bloque de destino, en el que la señal de predicción se produce usando la información de predicción del bloque adyacente;
la figura 14 es un diagrama que muestra otro ejemplo de la partición;
la figura 15 es un diagrama que muestra otros ejemplos del bloque de destino y del bloque adyacente;
la figura 16 es un diagrama que muestra un programa de codificación predictiva de imágenes según una realización; la figura 17 es un diagrama que muestra un programa de descodificación predictiva de imágenes según una realización;
la figura 18 es un diagrama que muestra una estructura de hardware de un ordenador para ejecutar un programa almacenado en un medio de grabación;
la figura 19 es una vista en perspectiva del ordenador para ejecutar el programa almacenado en el medio de grabación;
la figura 20 es una vista esquemática que describe un procedimiento de predicción intra-imagen usado en la recomendación H.264 de la ITU; y
la figura 21 es una vista esquemática que describe la correlación de bloques.
Descripción de realizaciones
Las realizaciones preferibles de la presente invención se describen en detalle a continuación con referencia a los dibujos. En cada dibujo, las partes que son la misma, o equivalentes, están etiquetadas con los mismos números de referencia.
La figura 1 es un diagrama que muestra un dispositivo de codificación predictiva de imágenes según una realización. Un dispositivo de codificación predictiva de imágenes 100, mostrado en la figura 1, incluye un terminal de entrada 102, una unidad de división de bloques 104, un generador de señales de predicción 106, una memoria de tramas 108, un restador 110, un transformador 112, un cuantizador 114, un cuantizador inverso 116, un transformador inverso 118, un sumador 120, un codificador de coeficientes transformados cuantizados 122, un terminal de salida 124, un estimador de información de predicción 126, una memoria de información de predicción 128, una unidad de decisión 130, un codificador de información de predicción 132, un elemento de determinación de anchura de regiones 134 y un codificador de anchura de regiones 136. El transformador 112, el cuantizador 114 y el codificador de coeficientes transformados cuantizados 122 funcionan como medios de codificación de señales residuales, mientras que el cuantizador inverso 116 y el transformador inverso 118 funcionan como medios de restauración de señales residuales.
A continuación, se describirá cada componente del dispositivo de codificación predictiva de imágenes 100. El terminal de entrada 102 es un terminal para introducir una señal de una imagen en movimiento. La señal de la imagen en movimiento es una señal que incluye una pluralidad de imágenes. El terminal de entrada 102 está conectado a través de una línea L102 a la unidad de división de bloques 104.
La unidad de división de bloques 104 divide la imagen que está incluida en la señal de la imagen en movimiento en una pluralidad de regiones. Específicamente, la unidad de división de bloques 104 selecciona de manera secuencial la pluralidad de imágenes que están incluidas en la señal de la imagen en movimiento como una imagen objetivo de codificación. La unidad de división de bloques 104 divide la imagen seleccionada en una pluralidad de regiones. En la presente realización, la región es un bloque de píxeles de tamaño 8 x 8. Sin embargo, el bloque con diferentes tamaños y/o formas puede usarse como la región. La unidad de división de bloques 104 está conectada a través de una línea L104 al estimador de información de predicción 126.
El estimador de información de predicción 126 detecta la información de predicción requerida para producir una señal de predicción de una región de destino (un bloque de destino) que es el objetivo del procesamiento de codificación. En cuanto a un procedimiento para producir información de predicción que sea un procedimiento de predicción, es aplicable la predicción intra-imagen o la predicción inter-imagen que se describió en la técnica anterior. La presente invención, sin embargo, no se limita a tales procedimientos de predicción. La descripción a continuación se proporciona en el caso en el que la correlación de bloques mostrada en la figura 21 se realiza en un proceso de predicción. Cuando se usa la correlación de bloques, la información de predicción incluye vectores de movimiento, información de selección de imagen de referencia y similares. A continuación en el presente documento, la información de predicción que se detecta para producir la señal de predicción del bloque de destino se denomina “información de predicción asociada a un bloque de destino”. El estimador de información de predicción 126 está conectado, a través de una línea L126a y una línea L126b, a la memoria de información de predicción 128 y al codificador de información de predicción 132, respectivamente.
La memoria de información de predicción 128 recibe la información de predicción a través de la línea L126a desde el estimador de información de predicción 126 y almacena la información de predicción. La memoria de información de predicción 128 está conectada, a través de una línea L128, a la unidad de decisión 130.
El codificador de información de predicción 132 recibe la información de predicción, a través de la línea L126b, desde el estimador de información de predicción 126. El codificador de información de predicción 132 codifica por entropía la información de predicción recibida para producir datos codificados y emite los datos codificados, a través de una línea L132, al terminal de salida 124. Ejemplos de codificación por entropía incluyen la codificación aritmética, la codificación de longitud variable, y similares, pero la presente invención no se limita a tales procedimientos de codificación por entropía.
La unidad de decisión 130 recibe la información de predicción asociada al bloque de destino y la información de predicción asociada a un bloque adyacente, a través de la línea L128, desde la memoria de información de predicción 128. El bloque adyacente es una región adyacente ubicada de manera adyacente al bloque de destino y es una región ya codificada. La unidad de decisión 130 compara la información de predicción asociada al bloque de destino con la información de predicción asociada al bloque adyacente, y decide si la información de predicción asociada al bloque adyacente puede usarse para producir la señal de predicción del bloque de destino.
Específicamente, la unidad de decisión 130 compara la información de predicción asociada al bloque de destino con la información de predicción asociada al bloque adyacente y, cuando los dos elementos de información de predicción coinciden, decide que la información de predicción asociada al bloque adyacente no se usará para producir la señal de predicción del bloque de destino. Esto es debido a que, cuando los dos elementos de información de predicción coinciden, la señal de predicción de una partición del bloque de destino, producida usando la información de predicción asociada al bloque adyacente, puede dar como resultado lo mismo que la señal de predicción producida usando la información de predicción asociada al bloque de destino. Es decir, no puede esperarse una reducción en el error de predicción.
Por otro lado, cuando los dos elementos de información de predicción son diferentes, la unidad de decisión 130 decide que la información de predicción asociada al bloque adyacente puede usarse para producir la señal de predicción del bloque de destino. La unidad de decisión 130 está conectada, a través de una línea L130, al elemento de determinación de anchura de regiones 134 y al codificador de anchura de regiones 136, y la unidad de decisión 130 emite un resultado de comparación (decisión), a través de la línea L130, al elemento de determinación de anchura de regiones 134 y al codificador de anchura de regiones 136. A continuación en el presente documento, el resultado de decisión, de un caso en el que la información de predicción asociada al bloque adyacente no se usará para producir la señal de predicción del bloque de destino, se menciona como el resultado de decisión que indica “inutilizable”, mientras que el resultado de decisión, de un caso en el que la información de predicción asociada al bloque adyacente puede usarse para producir la señal de predicción del bloque de destino, se menciona como el resultado de decisión que indica “utilizable”. A continuación, se describen en detalle las operaciones de la unidad de decisión 130.
El elemento de determinación de anchura de regiones 134 recibe el resultado de decisión, a través de la línea L130, desde la unidad de decisión 130. Cuando el resultado de decisión indica “utilizable”, el elemento de determinación de anchura de regiones 134 determina una anchura de región de la partición del bloque de destino en la que la señal de predicción se produce usando la información de predicción asociada al bloque adyacente. Por tanto, el elemento de determinación de anchura de regiones 134 recibe la información de predicción asociada al bloque de destino y la información de predicción asociada al bloque adyacente, a través de una línea L128a, desde la memoria de información de predicción 128. Además, el elemento de determinación de anchura de regiones 134 recibe una señal reconstruida desde la memoria de tramas 108 y recibe una señal original del bloque de destino desde la unidad de división de bloques 104.
La figura 2 es un diagrama que describe la partición del bloque de destino, en el que se produce la señal de predicción usando la información de predicción del bloque adyacente. La figura 2 muestra un caso en el que un bloque B1 adyacente a la izquierda de un bloque Bt de destino sirve como bloque adyacente, pero el bloque adyacente en la presente invención puede ser un bloque adyacente en la parte superior del bloque de destino, o ambos bloques adyacentes a la izquierda y en la parte superior del bloque de destino. Existen casos en los que puede usarse bloques adyacentes, a la derecha y en la parte inferior del bloque de destino, como el bloque adyacente.
Tal como se muestra en la figura 2, el bloque Bt de destino y el bloque B1 adyacente son un bloque de píxeles de tamaño 8 x 8. En la figura 2, una posición de píxel superior izquierda (posición horizontal, posición vertical) se representa mediante (0, 0), mientras que una posición de píxel inferior derecha (posición horizontal, posición vertical) se representa mediante (7, 7). Una partición R2 mostrada en la figura 2 es una región en la que la información de predicción del bloque B1 adyacente se usa para producir la señal de predicción, y la anchura de región de la misma es w en una dirección horizontal. Es decir, la partición R2 está rodeada por cuatro posiciones de píxel de (0,0), (w-1, 0), (0, 7) y (w-1, 7). Una partición R1 es una región en la que la información de predicción asociada al bloque de destino se usa para producir la señal de predicción.
En la presente realización, la anchura de región puede ajustarse desde 0 hasta 8 píxeles, con incremento de un píxel. El elemento de determinación de anchura de regiones 134 de la presente realización produce la señal de predicción del bloque de destino con respecto a cada una de las 9 anchuras de región ajustables y selecciona la anchura de región que tenga la mínima suma absoluta del error de predicción o la mínima suma cuadrática del mismo. El proceso se realiza adquiriendo una señal original del bloque de destino y la información de predicción asociada al bloque de destino, y la información de predicción asociada al bloque adyacente, desde la unidad de división de bloques 104 y la memoria de información de predicción 128, respectivamente, y produciendo la señal de predicción del bloque de destino, basándose en estos elementos de información de predicción y en la anchura de región, a partir de la señal reconstruida que está almacenada en la memoria de tramas 108. Un procedimiento para determinar la anchura de región, y los candidatos para la anchura de región ajustable, no están particularmente limitados. Por ejemplo, las anchuras de región ajustables pueden ser anchuras de píxel que se especifican en múltiplos de 2, y pueden adoptar una o más anchuras. Adicionalmente, se preparan una pluralidad de anchuras de región ajustables y puede codificarse información de selección para cada unidad de secuencia, cada unidad de trama o cada unidad de bloque.
El elemento de determinación de anchura de regiones 134 está conectado, a través de una línea L134a y una línea L134b, al codificador de anchura de regiones 136 y al generador de señales de predicción 106, respectivamente. El elemento de determinación de anchura de regiones 134 emite la anchura de región determinada (información que identifica la anchura de región), a través de la línea L134a y la línea L134b, al codificador de anchura de regiones 136 y al generador de señales de predicción 106.
Cuando el resultado de decisión recibido desde la unidad de decisión 130 indica “utilizable”, el codificador de anchura de regiones 136 codifica por entropía la anchura de región recibida a través de la línea L134a para producir datos codificados. El codificador de anchura de regiones 136 puede usar un procedimiento de codificación por entropía, tal como codificación aritmética o codificación de longitud variable, pero la presente invención no se limita a tales procedimientos de codificación.
El codificador de anchura de regiones 136 está conectado, a través de una línea L136, al terminal de salida 124, y los datos codificados producidos por el codificador de anchura de regiones 136 se emiten, a través de la línea L136, al terminal de salida 124.
El generador de señales de predicción 106 recibe dos elementos de información de predicción, asociados al bloque de destino y al bloque adyacente, a través de una línea L128b, desde la memoria de información de predicción 128. Adicionalmente, el generador de señales de predicción 106 recibe la anchura de región, a través de la línea L134b, desde el elemento de determinación de anchura de regiones 134, y recibe la señal reconstruida, a través de una línea L108, desde la memoria de tramas 108. El generador de señales de predicción 106 usa los dos elementos de información de predicción y la anchura de región recibidos para producir la señal de predicción del bloque de destino a partir de la señal reconstruida. A continuación, se describen ejemplos de un procedimiento para producir la señal de predicción. El generador de señales de predicción 106 está conectado, a través de una línea L106, al restador 110. La señal de predicción producida por el generador de señales de predicción 106 se emite, a través de la línea L106, al restador 110.
El restador 110 está conectado, a través de una línea L104b, a la unidad de división de bloques 104. El restador 110 resta la señal de predicción del bloque de destino, producida por el generador de señales de predicción 106, a la señal original del bloque de destino, que se recibe, a través de la línea L104b, desde la unidad de división de bloques 104. Una señal residual se produce mediante tal resta. El restador 110 está conectado, a través de una línea L110, al transformador 112 y la señal residual se emite, a través de la línea L110, al transformador 112.
El transformador 112 aplica una transformada de coseno discreta a la señal residual de entrada para producir coeficientes transformados. El cuantizador 114 recibe los coeficientes transformados, a través de una línea L112, desde el transformador 112. El cuantizador 114 cuantiza los coeficientes transformados para producir coeficientes transformados cuantizados. El codificador de coeficientes transformados cuantizados 122 recibe los coeficientes transformados cuantizados, a través de una línea L114, desde el cuantizador 114 y codifica por entropía los coeficientes transformados cuantizados para producir datos codificados. El codificador de coeficientes transformados cuantizados 122 emite los datos codificados producidos, a través de una línea L122, al terminal de salida 124. Como procedimiento de codificación por entropía para el codificador de coeficientes transformados cuantizados 122, puede usarse codificación aritmética o codificación de longitud variable, pero la presente invención no se limita a tales procedimientos de codificación.
El terminal de salida 124 emite hacia fuera, de manera colectiva, los datos codificados recibidos desde el codificador de información de predicción 132, el codificador de anchura de regiones 136 y el codificador de coeficientes transformados cuantizados 122.
El cuantizador inverso 116 recibe los coeficientes transformados cuantizados, a través de una línea L114b, desde el cuantizador 114. El cuantizador inverso 116 cuantiza de manera inversa los coeficientes transformados cuantizados recibidos, para restaurar los coeficientes transformados. El transformador inverso 118 recibe los coeficientes transformados, a través de una línea L116, desde el cuantizador inverso 116 y aplica una transformada de coseno discreta inversa a los coeficientes transformados, para restaurar una señal residual (señal residual descodificada). El sumador 120 recibe la señal residual descodificada, a través de una línea L118, desde el transformador inverso 118 y recibe la señal de predicción, a través de una línea L106b, desde el generador de señales de predicción 106. El sumador 120 añade la señal residual descodificada recibida a la señal de predicción para reproducir una señal del bloque de destino (señal reconstruida). La señal reconstruida producida por el sumador 120 se emite, a través de una línea L120, a la memoria de tramas 108 y se almacena en la memoria de tramas 108 como la señal reconstruida.
La presente realización usa el transformador 112 y el transformador inverso 118, pero puede usarse otro proceso de transformación como alternativa a estos transformadores. Además, el transformador 112 y el transformador inverso 118 no son indispensables. De esta manera, con el fin de usarse para producir la señal de predicción del bloque de destino posterior, la señal reconstruida del bloque de destino codificado se restaura en un proceso inverso y se almacena en la memoria de tramas 108.
Además, la estructura del codificador no se limita a la mostrada en la figura 1. Por ejemplo, la unidad de decisión 130 y la memoria de información de predicción 128 pueden incluirse en el generador de señales de predicción 106. Adicionalmente, el elemento de determinación de anchura de regiones 134 puede incluirse en el estimador de información de predicción 126.
Con referencia a las operaciones del dispositivo de codificación predictiva de imágenes 100, se describe a continuación un procedimiento de codificación predictiva de imágenes de una realización. Adicionalmente, se describen operaciones detalladas de la unidad de decisión 130, el elemento de determinación de anchura de regiones 134 y el generador de señales de predicción 106.
La figura 3 es un diagrama de flujo que muestra procedimientos del procedimiento de codificación predictiva de imágenes según una realización. Tal como se muestra en la figura 3, en el presente procedimiento de codificación predictiva de imágenes, en primer lugar en la etapa S100, la unidad de división de bloques 104 divide una imagen objetivo de codificación en una pluralidad de bloques. Entonces, en la etapa S102, se selecciona un bloque entre la pluralidad de bloques como bloque de destino de codificación.
Entonces, en la etapa S104, el estimador de información de predicción 126 determina la información de predicción del bloque de destino. La información de predicción es codificada en la siguiente etapa S106 por el codificador de información de predicción 132.
A continuación, el presente procedimiento de codificación predictiva de imágenes avanza a la etapa S108. La figura 4 es un diagrama de flujo detallado de la etapa S108 en la figura 3. En el proceso de la etapa S108, en primer lugar en la etapa S200, se introducen dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente, en la unidad de decisión 130. Entonces, en la etapa S202, la unidad de decisión 130 decide si la información de predicción del bloque adyacente puede usarse para producir la señal de predicción del bloque de destino.
La figura 5 es un diagrama de flujo detallado de la etapa S202 en la figura 4. Tal como se muestra en la figura 5, en el proceso de la etapa S202, en primer lugar en la etapa S300, la unidad de decisión 130 decide si coinciden los dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente. Cuando la decisión en la etapa S300 es verdadera (Sí), es decir, cuando los dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente coinciden, la unidad de decisión 130 emite un resultado de decisión que indica “inutilizable” en la etapa S302.
Por otro lado, cuando la decisión en la etapa S300 es falsa (No), el proceso avanza a la etapa S304. En la etapa S304, la unidad de decisión 130 decide si la información de predicción asociada al bloque adyacente está en un estado utilizable para producir la señal de predicción del bloque de destino. Cuando la decisión en la etapa S304 es verdadera (Sí), la unidad de decisión 130 emite el resultado de decisión que indica “utilizable” en la siguiente etapa S306. Por otro lado, cuando la decisión en la etapa S304 es falsa (No), la unidad de decisión 130 lleva a cabo el proceso de la etapa S302 descrito anteriormente.
Cuando se decide que la información de predicción asociada al bloque adyacente está en un estado inutilizable en la etapa S304, existen casos en los que (1) el bloque adyacente está fuera de una imagen; (2) no está aprobada una combinación de la información de predicción del bloque de destino y de la información de predicción del bloque adyacente; y similares.
De esta manera, la unidad de decisión 130 decide, según una regla predeterminada, si se usa la información de predicción asociada al bloque adyacente para producir la señal de predicción de la partición de la región de destino. No se requiere transmitir la regla, si el codificador y el descodificador comparten la información de antemano, pero puede codificarse y transmitirse. Por ejemplo, existe un procedimiento en el que se preparan una pluralidad de tales reglas y se transmite qué regla debe aplicarse para cada unidad de trama, cada unidad de secuencia o cada unidad de bloque.
A continuación, haciendo de nuevo referencia a la figura 4, el presente procedimiento de codificación predictiva de imágenes avanza a la etapa S204. En la etapa S204, el elemento de determinación de anchura de regiones 134 se refiere al resultado de la decisión de la unidad de decisión 130 y decide si el resultado de la decisión indica “utilizable” o no. Cuando el resultado de la decisión de la unidad de decisión 130 indica “inutilizable”, el proceso de la etapa S108 finaliza.
Por otro lado, cuando el resultado de la decisión de la unidad de decisión 130 indica “utilizable”, el elemento de determinación de anchura de regiones 134 selecciona, en la siguiente etapa S206, la anchura de región de la partición de la región de destino que va a predecirse usando la información de predicción asociada al bloque adyacente, entre los candidatos preparados de antemano. Entonces, en la etapa S208, el codificador de anchura de regiones 136 codifica la anchura de región determinada.
Haciendo de nuevo referencia a la figura 3, el proceso avanza desde la etapa S108 hasta la etapa S110. En la etapa S110, el generador de señales de predicción 106 usa los dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente, y la anchura de región determinada por el elemento de determinación de anchura de regiones 134, para producir la señal de predicción del bloque de destino a partir de la señal reconstruida almacenada en la memoria de tramas 108.
A continuación, se describe un ejemplo de operaciones detalladas del generador de señales de predicción 106 en la etapa S110. La figura 6 es un diagrama de flujo detallado de la etapa S110 en la figura 3. La figura 6 muestra operaciones del generador de señales de predicción 106, cuando, tal como se muestra en la figura 2, la señal de predicción de una partición R2 en un bloque de destino de píxeles de tamaño 8 x 8 se produce usando la información de predicción asociada al bloque adyacente a la izquierda.
Tal como se muestra en la figura 6, en primer lugar en la etapa S400, el generador de señales de predicción 106 adquiere información Pt de predicción asociada al bloque de destino e información Pn de predicción asociada al bloque adyacente. Entonces, en la etapa S402, el generador de señales de predicción 106 adquiere una anchura w de región desde el elemento de determinación de anchura de regiones 134.
A continuación, en la etapa S404, el generador de señales de predicción 106 usa la información Pt de predicción y la anchura w de región para producir la señal de predicción de la partición R1 en el bloque de destino mostrado en la figura 2, a partir de la señal reconstruida. A continuación, en la etapa S406, el generador de señales de predicción 106 usa la información Pn de predicción y la anchura w de región para producir una señal de predicción de la partición R2 en el bloque de destino, a partir de la señal reconstruida. En el ejemplo mostrado en la figura 2, cuando la anchura w de región es 0, puede omitirse la etapa S406. Adicionalmente, cuando la anchura de región es 8, puede omitirse la etapa S404.
Haciendo de nuevo referencia a la figura 3, el procedimiento de codificación predictiva de imágenes avanza a la etapa S112. En la etapa S112, el restador 110 usa la señal original y la señal de predicción del bloque de destino para producir una señal residual. En la siguiente etapa S114, el transformador 112, el cuantizador 114 y el codificador de coeficientes transformados cuantizados 122 transforman y codifican la señal residual para producir datos codificados.
Entonces, en la etapa S116, el cuantizador inverso 116 y el transformador inverso 118 restauran una señal residual descodificada a partir de coeficientes transformados cuantizados. En la siguiente etapa S118, el sumador 120 añade la señal residual descodificada a la señal de predicción para producir una señal reconstruida. Entonces, en la etapa S120, la señal reconstruida se almacena en la memoria de tramas 108 como la señal reconstruida.
A continuación, en la etapa S122, se comprueba si todos los bloques se procesan como bloque de destino y, cuando el proceso está incompleto en todos los bloques, se selecciona uno de los bloques sin procesar como el bloque de destino y se realiza el proceso desde la etapa S102. Por otro lado, cuando el proceso está completado en todos los bloques, el proceso del presente procedimiento de codificación predictiva de imágenes finaliza.
A continuación, se describe un dispositivo de descodificación predictiva de imágenes según una realización. La figura 7 es un diagrama que muestra el dispositivo de descodificación predictiva de imágenes según una realización. Un dispositivo de descodificación predictiva de imágenes 200, mostrado en la figura 7, está dotado de un terminal de entrada 202, un analizador de datos 204, un cuantizador inverso 206, un transformador inverso 208, un sumador 210, un terminal de salida 212, un descodificador de coeficientes transformados cuantizados 214, un descodificador de información de predicción 216, un descodificador de anchura de región 218, la memoria de tramas 108, el generador de señales de predicción 106, la memoria de información de predicción 128 y la unidad de decisión 130. El cuantizador inverso 206, el transformador inverso 208 y el descodificador de coeficientes transformados cuantizados 214 funcionan como medios de restauración de señales residuales. Pueden usarse alternativas para medios de descodificación que incluyen el cuantizador inverso 206 y el transformador inverso 208. Adicionalmente, puede eliminarse el transformador inverso 208.
A continuación, se describe en detalle cada componente del dispositivo de descodificación predictiva de imágenes 200. El terminal de entrada 202 introduce datos comprimidos que han sido codificados por compresión mediante el dispositivo de codificación predictiva de imágenes 100 (o el procedimiento de codificación predictiva de imágenes) descrito anteriormente. Los datos comprimidos incluyen, con respecto a cada uno entre una pluralidad de bloques en una imagen, datos codificados de coeficientes transformados cuantizados, producidos cuantizando mediante transformación y codificando por entropía una señal residual; datos codificados de información de predicción para producir una señal de predicción; y datos codificados de una anchura de región de una partición en el bloque, en donde se produce la señal de predicción usando la información de predicción asociada a un bloque adyacente ubicado de manera adyacente a un bloque de destino. En la presente realización, la información de predicción incluye un vector de movimiento y un número de imagen de referencia, y similares. El terminal de entrada 202 está conectado, por medio de una línea L202, al analizador de datos 204.
El analizador de datos 204 recibe los datos comprimidos, a través de la línea L202, desde el terminal de entrada 202. El analizador de datos 204 analiza los datos comprimidos recibidos y separa los datos comprimidos, con respecto a un bloque de destino de descodificación, en los datos codificados de los coeficientes transformados cuantizados; los datos codificados de la información de predicción; y los datos codificados de la anchura de región. El analizador de datos 204 emite los datos codificados de la anchura de región, a través de una línea L204a, al descodificador de anchura de región 218; emite los datos codificados de la información de predicción, a través de una línea L204b, al descodificador de información de predicción 216; y emite los datos codificados de los coeficientes transformados cuantizados, a través de una línea L204c, al descodificador de coeficientes transformados cuantizados 214.
El descodificador de información de predicción 216 descodifica por entropía los datos codificados de la información de predicción asociada al bloque de destino para obtener información de predicción. El descodificador de información de predicción 216 está conectado, a través de una línea L216, a la memoria de información de predicción 128. La información de predicción producida por el descodificador de información de predicción 216 es almacenada, a través de la línea L216, en la memoria de información de predicción 128. La memoria de información de predicción 128 está conectada, a través de la línea L128a y la línea L128b, a la unidad de decisión 130 y al generador de señales de predicción 106, respectivamente.
La unidad de decisión 130 tiene la misma función que la unidad de decisión 130 del dispositivo de descodificación mostrado en la figura 1. Es decir, la unidad de decisión 130 compara la información de predicción asociada al bloque de destino con la información de predicción asociada al bloque adyacente ubicado de manera adyacente al bloque de destino, y decide si la información de predicción asociada al bloque adyacente puede usarse cuando se produce la señal de predicción del bloque de destino.
Específicamente, la unidad de decisión 130 compara los dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente, ubicados de manera adyacente entre sí y, cuando los dos elementos de información de predicción coinciden, decide que la información de predicción asociada al bloque adyacente no se usará para producir la señal de predicción del bloque de destino. Es decir, en tal caso, la unidad de decisión 130 emite un resultado de decisión que indica “inutilizable”. Por otro lado, cuando los dos elementos de información de predicción son diferentes, la unidad de decisión 130 emite el resultado de decisión que indica “utilizable”. La unidad de decisión 130 está conectada, a través de la línea L130, al descodificador de anchura de región 218. El resultado de la decisión mediante la unidad de decisión 130 se emite, a través de la línea L130, al descodificador de anchura de región 218. Dado que ya se ha descrito en la figura 5 un flujo de proceso detallado del proceso de la unidad de decisión 130, se omite aquí la descripción detallada.
El descodificador de anchura de región 218 descodifica por entropía, basándose en el resultado de la decisión, recibido a través de la L130 desde la unidad de decisión 130, los datos codificados de entrada de la anchura de región, para restaurar la anchura de región. Es decir, cuando el resultado de la decisión indica “utilizable”, el descodificador de anchura de región 218 descodifica los datos codificados de la anchura de región, para restaurar la anchura de región. Por otra parte, cuando el resultado de la decisión es “inutilizable”, no puede llevarse a cabo la restauración de la anchura de región. El descodificador de anchura de región 218 está conectado, a través de una línea L218, al generador de señales de predicción 106, y la anchura de región producida por el descodificador de anchura de región 218 se emite, a través de la línea L218, al generador de señales de predicción 106.
El generador de señales de predicción 106 tiene la misma función que el generador de señales de predicción del dispositivo de codificación mostrado en la figura 1. Es decir, el generador de señales de predicción 106 usa la información de predicción asociada al bloque de destino y la información de predicción asociada al bloque adyacente (si es necesaria), así como la anchura de región recibida a través de la L218, para producir la señal de predicción del bloque objetivo de descodificación a partir de la señal reconstruida almacenada en la memoria de tramas 108. Dado que se describen en la figura 6 las operaciones detalladas del generador de señales de predicción 106, se omite aquí la descripción detallada. El generador de señales de predicción 106 está conectado, a través de la línea L106, al sumador 210. El generador de señales de predicción 106 emite la señal de producción producida, a través de la línea L106, al sumador 210.
El descodificador de coeficientes transformados cuantizados 214 recibe los datos codificados de los coeficientes transformados cuantizados, a través de la línea L204c, desde el analizador de datos 204. El descodificador de coeficientes transformados cuantizados 214 descodifica por entropía los datos codificados recibidos para restaurar los coeficientes transformados cuantizados de la señal residual del bloque de destino. El descodificador de coeficientes transformados cuantizados 214 emite los coeficientes transformados cuantizados restaurados, a través de una línea L214, al cuantizador inverso 206.
El cuantizador inverso 206 cuantiza de manera inversa los coeficientes transformados cuantizados, recibidos a través de la línea L214, para restaurar los coeficientes transformados. El transformador inverso 208 recibe los coeficientes transformados restaurados, a través de una línea L206, desde el cuantizador inverso 206 y aplica una transformada de coseno discreta inversa a los coeficientes transformados para restaurar la señal residual (señal residual descodificada) del bloque de destino.
El sumador 210 recibe la señal residual descodificada, a través de una línea L208, desde el transformador inverso 208 y recibe la señal de predicción producida por el generador de señales de predicción 106, a través de la línea L106. El sumador 210 produce una señal reconstruida del bloque de destino añadiendo la señal residual descodificada recibida a la señal de predicción. La señal reconstruida se emite, a través de una línea L210, a la memoria de tramas 108 y se almacena en la memoria de tramas 108. Adicionalmente, la señal reconstruida también se emite al terminal de salida 212. El terminal de salida 212 emite la señal reconstruida al exterior (a un visor, por ejemplo).
Con referencia a las operaciones del dispositivo de descodificación predictiva de imágenes 200, se describe a continuación un procedimiento de descodificación predictiva de imágenes según una realización. La figura 8 es un diagrama de flujo del procedimiento de descodificación predictiva de imágenes según una realización. Tal como se muestra en la figura 8, en el presente procedimiento de descodificación predictiva de imágenes, en primer lugar en la etapa S500, se introducen datos comprimidos a través del terminal de entrada 202. Entonces, en la etapa S502, se selecciona un bloque de destino que es el objetivo del proceso.
Entonces, en la etapa S504, el analizador de datos 204 analiza los datos comprimidos y extrae datos codificados de información de predicción asociada al bloque de destino que es un objetivo de descodificación; de una anchura de región; y de coeficientes transformados cuantizados. La información de predicción es descodificada por el descodificador de información de predicción 216 en la etapa S506.
A continuación, el proceso avanza a la etapa S508. La figura 9 es un diagrama de flujo detallado de la etapa S508 en la figura 8. Tal como se muestra en la figura 9, en el proceso de la etapa S508, en primer lugar en la etapa S600, se introducen dos elementos de información de predicción asociados al bloque de destino y a un bloque adyacente en la unidad de decisión 130.
A continuación, en la etapa S202, la unidad de decisión 130 decide la capacidad de uso de la información de predicción asociada al bloque adyacente y emite un resultado de decisión. Las operaciones de la unidad de decisión 130 en la etapa S202 son las mismas que las operaciones descritas en la figura 5, por lo que se omite aquí la descripción detallada.
Entonces, en la etapa S602, se decide si el resultado de la decisión de la unidad de decisión 130 indica “utilizable” o no. Cuando el resultado de la decisión en la etapa S602 es verdadero (Sí), es decir, cuando es utilizable la información de predicción del bloque adyacente, el descodificador de anchura de región 218 descodifica los datos codificados de la anchura de región para restaurar la anchura de región de una partición (R2) del bloque de destino en la etapa S604. Por otro lado, cuando la decisión en la etapa S602 es falsa (No), el descodificador de anchura de región 218 fija la anchura de región de la partición (R2) del bloque de destino en 0 en la etapa S606.
Haciendo de nuevo referencia a la figura 8, después de que finaliza la etapa S508, el proceso avanza a la etapa S510. En la etapa S510, el generador de señales de predicción 106 produce una señal de predicción del bloque de destino de descodificación a partir de la señal reconstruida, usando los dos elementos de información de predicción asociados al bloque de destino y al bloque adyacente (solo se usa información de predicción asociada al bloque adyacente cuando es necesario), y la anchura de región. En este caso, la etapa S510 es la misma que la etapa S110 descrita en la figura 6.
En la siguiente etapa S512, el descodificador de coeficientes transformados cuantizados 214 restaura los coeficientes transformados cuantizados a partir de los datos codificados; el cuantizador inverso 206 restaura los coeficientes transformados a partir de los coeficientes transformados cuantizados; y el transformador inverso 208 produce una señal residual descodificada a partir de los coeficientes transformados.
Entonces, en la etapa S514, el sumador 210 produce una señal reconstruida del bloque de destino añadiendo la señal de predicción del bloque de destino a la señal residual descodificada. En la etapa S516, la señal reconstruida se almacena en la memoria de tramas 108 como la señal reconstruida para reproducir el siguiente bloque de destino.
Entonces, en la etapa S518, cuando se decide que el proceso está incompleto en todos los bloques, es decir, cuando existen los siguientes datos comprimidos, se selecciona un bloque sin procesar como el bloque de destino en la etapa S502 y se repiten las etapas después de la misma. Por otro lado, cuando el proceso está completado en todos los bloques en la etapa S518, el proceso finaliza.
El dispositivo y el procedimiento de codificación predictiva de imágenes, así como el dispositivo y el procedimiento de descodificación predictiva de imágenes, según una realización, se han descrito anteriormente, pero la presente invención no se limita a la realización mencionada anteriormente. Por ejemplo, el bloque adyacente en la realización anterior es el bloque adyacente a la izquierda del bloque de destino, pero puede ser el bloque adyacente en la parte superior del bloque de destino.
La figura 10 es un diagrama que describe otro ejemplo del bloque adyacente. En el ejemplo mostrado en la figura 10, el bloque Bt de destino y el bloque B2 adyacente son un bloque de píxeles de tamaño 8 x 8 y, de manera similar, una posición de píxel superior izquierda (posición horizontal, posición vertical) está fijada en (0, 0), mientras que una posición de píxel inferior derecha está fijada en (7, 7). La partición R2 es una región rodeada por las posiciones de píxel (0, 0), (7, 0), (0, w-1) y (7, w-1) y la región en la que es probable que la información de predicción del bloque B2 adyacente sea usada para producir la señal de predicción. La anchura de región de la partición R2 es w.
Cuando la información de predicción asociada al bloque B2 adyacente mostrado en la figura 10 se usa para producir la señal de predicción de la partición R2, un intervalo de x en la etapa S404 de la figura 6 es de 0 a 7, mientras que un intervalo de y es de w a 7. Adicionalmente, el intervalo de x en la etapa S406 de la figura 6 es de 0 a 7, mientras que el intervalo de y es de 0 a w-1.
Adicionalmente, el bloque adyacente puede ser dos bloques adyacentes, uno de los cuales está a la izquierda y el otro está en la parte superior del bloque de destino, y es posible seleccionar cualquiera de los dos bloques adyacentes con respecto a cada bloque de destino. En tal caso, el generador de señales de predicción 106 tiene una función de realización del proceso de predicción descrito con referencia a la figura 4 y a la figura 10, y el elemento de determinación de anchura de regiones 134 incluye una función de selección del bloque adyacente que tenga la información de predicción que se usa para predecir la partición del bloque de destino, es decir, o bien el bloque adyacente a la izquierda, o bien en la parte superior del bloque de destino. Adicionalmente, el codificador de anchura de regiones 136 incluye una función de codificación de información de identificación que identifica el bloque adyacente que tenga la información de predicción que va a usarse para producir la señal de predicción de la región de destino, a partir de los dos elementos de información de predicción asociados a los dos bloques adyacentes, mientras que el descodificador de anchura de región 218 incluye una función de descodificación de la información de identificación.
A continuación, se proporciona una descripción detallada para la etapa S108 cuando se usan dos bloques adyacentes, a la izquierda y en la parte superior. La figura 11 es un diagrama de flujo que muestra procedimientos detallados de otro ejemplo de la etapa S108 en la figura 3. Tal como se muestra en la figura 11, en el proceso de la etapa S108 del presente ejemplo, se introducen dos elementos de información de predicción, asociados a bloques adyacentes en la parte superior y a la izquierda del bloque de destino, en la unidad de decisión 130 en la etapa S700.
A continuación, la unidad de decisión 130 decide, según los procedimientos mostrados en la etapa S202 de la figura 5, si la información de predicción asociada al bloque adyacente a la izquierda del bloque de destino puede usarse para producir la señal de predicción de la partición del bloque de destino, y emite un resultado de decisión. Entonces, en la etapa S704, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “inutilizable” (en el caso de No), es decir, cuando el resultado de la decisión muestra que la información de predicción asociada al bloque adyacente a la izquierda no se usará para producir la señal de predicción de la partición del bloque de destino; el procedimiento avanza a la siguiente etapa S202. La unidad de decisión 130 decide, según los procedimientos mostrados en la etapa S202 de la figura 5, si la información de predicción asociada al bloque adyacente en la parte superior del bloque de destino puede usarse para producir la señal de predicción de la partición del bloque de destino y emite un resultado de decisión.
Entonces, en la etapa S706, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “inutilizable” (en el caso de No), es decir, cuando el resultado de la decisión muestra que la información de predicción asociada al bloque adyacente en la parte superior no se usará para producir la señal de predicción de la partición del bloque de destino; el proceso de la etapa S108 finaliza.
Por otro lado, en la etapa S706, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “utilizable” (en el caso de Sí), el elemento de determinación de anchura de regiones 134 determina, en la etapa S708, la anchura w de región de la partición R2 (remítase a la figura 10) del bloque de destino, en donde se produce la señal de predicción usando la información de predicción del bloque adyacente en la parte superior. Entonces, en la siguiente etapa S208, la anchura w de región es codificada por el codificador de anchura de regiones 136.
Por otro lado, de vuelta en la etapa S704, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “utilizable” (en el caso de Sí), la unidad de decisión 130 decide en la siguiente etapa S202, según los procedimientos mostrados en la etapa S202 de la figura 5, si la información de predicción asociada al bloque adyacente en la parte superior del bloque de destino puede usarse para producir la señal de predicción de la partición del bloque de destino y emite un resultado de la decisión.
Entonces, en la etapa S710, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “inutilizable” (en el caso de No), el elemento de determinación de anchura de regiones 134 determina, en la siguiente etapa S712, la anchura w de región de la partición R2 (remítase a la figura 2) del bloque de destino, en donde se produce la señal de predicción usando la información de predicción del bloque adyacente a la izquierda. Entonces, la anchura w de región es codificada por el codificador de anchura de regiones 136 en la siguiente etapa S208.
Por otro lado, en la etapa S710, cuando se decide que el resultado de la decisión de la unidad de decisión 130 indica “utilizable” (en el caso de Sí), se selecciona el bloque adyacente que tenga la información de predicción que va a usarse para producir la señal de predicción, en la siguiente etapa S714, a partir del bloque adyacente a la izquierda y del bloque adyacente en la parte superior.
Específicamente, en la etapa S714, el elemento de determinación de anchura de regiones 134 selecciona cuál, entre la información de predicción del bloque adyacente en la parte superior y la información de predicción del bloque adyacente a la izquierda, va a usarse para producir la señal de predicción de la partición del bloque de destino. El procedimiento para la selección no está limitado, pero, por ejemplo, el elemento de determinación de anchura de regiones 134 fija las anchuras del bloque adyacente y de la partición R2, tal como se muestra en la figura 2 y la figura 10; produce la señal de predicción del bloque de destino usando la información de predicción del bloque adyacente y la información de predicción del bloque de destino; y selecciona un grupo del bloque adyacente y la anchura de región que haga que los errores de predicción del bloque de destino sean los más pequeños. Entonces, en la siguiente etapa S716, el codificador de anchura de regiones 136 codifica información de identificación que identifica el bloque adyacente que tiene la información de predicción seleccionada. A continuación, en la etapa S718, cuando se decide que se selecciona el bloque adyacente a la izquierda, el proceso avanza a la etapa S712. Por otro lado, en la etapa S718, cuando se decide que no se selecciona el bloque adyacente a la izquierda, es decir, cuando se decide que se selecciona el bloque adyacente en la parte superior, el proceso avanza a la etapa S708.
La figura 12 es un diagrama de flujo que muestra procedimientos detallados de otro ejemplo en la etapa S508 de la figura 8, que muestra procedimientos usados en la descodificación correspondiente a la codificación en la que se usa el proceso de la figura 11. Tal como se muestra en la figura 12, en este ejemplo, en primer lugar en la etapa S800, se introducen la información de predicción asociada al bloque adyacente a la izquierda del bloque de destino y la información de predicción asociada al bloque adyacente en la parte superior en la unidad de decisión 130.
En las dos etapas siguientes, la unidad de decisión 130 decide, según los procedimientos mostrados en la etapa S202 de la figura 5, la capacidad de uso de la información de predicción asociada al bloque adyacente a la izquierda y la capacidad de uso de la información de predicción asociada al bloque adyacente en la parte superior, y emite un resultado de la decisión.
A continuación, en la etapa S802, el descodificador de anchura de región 218 decide, basándose en el resultado de la decisión de la unidad de decisión 130, si es utilizable o no la información de predicción asociada a uno cualquiera de los dos bloques adyacentes. Cuando es inutilizable la información de predicción asociada a cualquiera de los bloques adyacentes, el descodificador de anchura de región 218 fija, en la etapa S804, la anchura de región de la partición R2 en el bloque de destino de descodificación en 0 y finaliza el proceso.
Por otro lado, en la etapa S802, cuando se decide que es utilizable la información de predicción asociada a uno cualquiera de los dos bloques adyacentes, el descodificador de anchura de región 218 decide, basándose en el resultado de la decisión de la unidad de decisión 130, en la siguiente etapa S806, si son utilizables o no ambas informaciones de predicción asociadas a los dos bloques adyacentes. Cuando son utilizables ambas informaciones de predicción de los dos bloques adyacentes, el descodificador de anchura de región 218 descodifica, en la siguiente etapa S808, información de identificación para identificar uno de los bloques adyacentes, a partir de los datos codificados, y avanza a la etapa S812.
Por otro lado, en la etapa S806, cuando se decide que es utilizable la información de predicción asociada a uno cualquiera de los dos bloques adyacentes, el descodificador de anchura de región 218 selecciona, basándose en el resultado de la decisión de la unidad de decisión 130, en la siguiente etapa S810, una de las informaciones de predicción asociadas a los dos bloques adyacentes y avanza a la etapa S812. En la etapa S812, el descodificador de anchura de región 218 descodifica un valor de la anchura de región.
La señal de predicción puede producirse usando tanto la información de predicción asociada al bloque adyacente a la izquierda del bloque de destino como la información de predicción asociada al bloque adyacente en la parte superior. En ese caso, el codificador de anchura de regiones 136 tiene una función de codificación de ambos grupos de los dos elementos de información de predicción asociados a los dos bloques adyacentes y dos anchuras de región, mientras que el descodificador de anchura de región 218 tiene una función de descodificación de ambos grupos de los dos elementos de información de predicción y las dos anchuras de región. Adicionalmente, en ese caso, tal como se muestra en la figura 13, se producen de manera individual señales de predicción de cuatro particiones R1 a R4 en el bloque Bt de destino.
Por consiguiente, el generador de señales de predicción 106 produce la señal de predicción de la partición R2 usando la información de predicción asociada al bloque B1 adyacente a la izquierda, y produce la señal de predicción de la partición R3 usando la información de predicción asociada al bloque B2 adyacente en la parte superior. Adicionalmente, es necesario que el generador de señales de predicción 106 tenga una función de producción de la señal de predicción de la partición R4. El procedimiento para predecir la partición R4, que puede proporcionarse de antemano como una regla, no está limitado en la presente invención. Ejemplos del procedimiento incluyen un procedimiento para promediar la señal de predicción de la partición R4 que se produce basándose en la información de predicción asociada al bloque adyacente a la izquierda, y la señal de predicción de la partición R4 que se produce basándose en la información de predicción asociada al bloque adyacente en la parte superior, con respecto a una unidad de píxel; y un procedimiento para producir la señal de predicción de la partición R4 basándose en la información de predicción asociada al bloque adyacente en la parte superior izquierda. Adicionalmente, puede adoptarse un procedimiento en el que se realiza automáticamente la selección, usando datos circundantes ya descodificados que incluyen la información de predicción asociada a los bloques adyacentes a la izquierda y en la parte superior, a partir de la información de predicción que pertenece a los bloques adyacentes en la parte superior y a la izquierda; o un procedimiento de transmisión de información de selección.
Además, pueden realizarse las siguientes modificaciones en la presente invención.
(Forma de bloque)
En la descripción anterior, la partición del bloque de destino es siempre rectangular pero, tal como se muestra en las particiones R1 y R2 del bloque Bt de destino en la figura 14(a), o tal como se muestra en las particiones R1 y R2 del bloque Bt de destino en la figura 14(b), puede usarse la partición en cualquier forma. En tal caso, se transmite información de forma además de una anchura de región.
(Tamaño de bloque)
En la descripción anterior, el tamaño de bloque es un tamaño fijo pero, tal como se muestra en (a) - (c) de la figura 15, el bloque Bt de destino y el bloque B1 adyacente pueden tener tamaños diferentes. En tal caso, tal como se muestra en (a) - (c) de la figura 15, pueden usarse diversas formas como forma de las particiones R1 a R3 en el bloque Bt de destino. Las particiones que van a constituirse pueden determinarse según las circunstancias, o puede seleccionarse la información que indica el bloque adyacente a partir de una pluralidad de candidatos, y puede codificarse de manera explícita. Adicionalmente, puede proporcionarse de antemano una regla predeterminada (por ejemplo, una unidad para seleccionar la anchura de región está alineada con el tamaño de bloque más pequeño). (Codificador y descodificador de anchura de región)
En el codificador de anchura de región, puede codificarse no un valor de anchura de región en sí mismo, pero sí información que identifica la anchura de región. Adicionalmente, en el descodificador de anchura de región, puede descodificarse no el valor de anchura de región en sí mismo, pero sí la información que identifica la anchura de región a partir de los datos codificados, y puede restaurarse el valor de anchura de región, basándose en la información que identifica la anchura de región. Por ejemplo, el codificador de anchura de región prepara una pluralidad de candidatos para los valores de anchura de región de la partición en el bloque de destino y puede codificar la información de identificación del candidato seleccionado. El descodificador de anchura de región puede restaurar el valor de anchura de región basándose en la información de identificación descodificada. Los candidatos para las anchuras de región pueden ser determinados de antemano por el codificador y el descodificador, o pueden transmitirse para cada unidad de secuencia o para cada unidad de trama. Adicionalmente, el codificador de anchura de región puede codificar un valor diferencial entre el valor de anchura de región de la partición en el bloque de destino y la anchura de región del bloque adyacente. En tal caso, el descodificador de anchura de región puede restaurar el valor de anchura de región de la partición en el bloque de destino añadiendo el valor de anchura de región ya codificado del bloque adyacente al valor diferencial descodificado a partir de los datos codificados. Como alternativa, el codificador de anchura de región puede codificar información que indica que la anchura de región de la partición en el bloque de destino es la misma que la anchura de región del bloque adyacente. Cuando se descodifica la información que indica que la anchura de región de la partición en el bloque de destino es la misma que la anchura de región del bloque adyacente, el descodificador de anchura de región puede usar la anchura de región del bloque adyacente como la anchura de región de la partición en el bloque de destino. En este caso, puede transmitirse información que indica que la anchura de región de la partición en el bloque de destino es diferente a la anchura de región del bloque adyacente, así como información que identifica el valor de anchura de región o la anchura de región. Cuando se descodifica la información que indica que la anchura de región de la partición en el bloque de destino es diferente a la anchura de región del bloque adyacente, el descodificador de anchura de región descodifica además la información que identifica el valor de anchura de región o la anchura de región a partir de los datos codificados, y puede restaurar el valor de anchura de región, basándose en la información que identifica la anchura de región. Adicionalmente, el codificador de anchura de región puede codificar uno o más elementos de información para identificar la anchura de región. Es decir, pueden ser codificados uno o más elementos de información que son capaces de identificar unívocamente la anchura de región (por ejemplo, uno o más bits). En tal caso, el descodificador de anchura de región descodifica uno o más elementos de información a partir de los datos codificados y puede restaurar la anchura de región, según dichos uno o más elementos de información.
(Transformador, transformador inverso)
Puede realizarse un proceso de transformación de la señal residual en un tamaño de bloque fijo. La región de destino puede dividirse adicionalmente en un tamaño que coincida con la partición y, con respecto a cada región producida por la división adicional, puede realizarse el proceso de transformación.
(Unidad de decisión)
El bloque adyacente, del que puede usarse información de predicción asociada al bloque adyacente, no se limita al bloque adyacente en la parte superior y al bloque adyacente a la izquierda del bloque de destino. Por ejemplo, cuando la información de predicción se codifica de antemano mediante una línea de bloque, los cuatro bloques ubicados adyacentes al bloque de destino han de ser el bloque adyacente, y los elementos de información de predicción asociados a los mismos pueden usarse para producir la señal de predicción del bloque de destino.
Adicionalmente, cuando los elementos de información de predicción de todos los bloques en una imagen se codifican de antemano, la señal de predicción de cada bloque de destino puede constituirse libremente usando un total de cinco elementos (nueve, cuando se incluyen el superior izquierdo, el inferior izquierdo, el superior derecho y el inferior derecho) de información de predicción asociados a cuatro bloques circundantes y al bloque de destino. Además, incluso si se proporciona la partición cuando el bloque de destino y el bloque adyacente tienen la misma información de predicción, es posible que el procesamiento de codificación y descodificación no falle nunca, de modo que pueda realizarse un proceso de producción de señales de predicción de la presente invención, incluso en una estructura en la que se omite una unidad de decisión.
(Acerca de la decisión de la unidad de decisión)
En la descripción anterior, según la regla predeterminada para la unidad de decisión 130, para decidir la capacidad de uso de la información de predicción asociada al bloque adyacente, se decide que no va a usarse la información de predicción asociada al bloque adyacente, cuando la información de predicción asociada al bloque adyacente coincide con la información de predicción asociada al bloque de destino, o cuando se decide que la información de predicción del bloque adyacente está en un estado inutilizable. En el último caso, cuando se predice el bloque adyacente mediante predicción intra-imagen y el bloque de destino se predice mediante predicción inter-imagen, y en el caso contrario; puede decidirse que no ha de usarse la información de predicción asociada al bloque adyacente. Adicionalmente, cuando una diferencia entre un vector de movimiento del bloque adyacente y un vector de movimiento del bloque de destino supera un valor de umbral, puede decidirse que no ha de usarse la información de predicción asociada al bloque adyacente. Además, cuando los tamaños de bloque del bloque adyacente y del bloque de destino son diferentes entre sí, puede decidirse que no ha de usarse la información de predicción asociada al bloque adyacente. En la descripción anterior, se comparan la información de predicción asociada al bloque adyacente y al bloque de destino pero, basándose en si las señales de predicción producidas con los dos elementos de información de predicción son la misma o no, puede decidirse la capacidad de uso de la información de predicción asociada al bloque adyacente.
(Información de predicción)
En la descripción anterior, la predicción inter-imagen (vector de movimiento e información de imagen de referencia) se describe como un procedimiento para producir la señal de predicción, pero la presente invención no se limita a tal procedimiento de predicción. El procedimiento de predicción que incluye la predicción intra-imagen, la compensación de luminancia, la predicción bidireccional o la retro-predicción, puede aplicarse al proceso de producción de señales de predicción de la presente invención. En tal caso, se incluyen la información de modalidad, un parámetro de compensación de luminancia y similares en la información de predicción.
(Señal de color)
En la descripción anterior, no se menciona particularmente un formato de color pero, independientemente de una señal de luminancia, puede realizarse un proceso de producción de la señal de producción, en cuanto a una señal de color o una señal de diferencia de color. Adicionalmente, el proceso de producción de la señal de predicción de la señal de color o de la señal de diferencia de color puede realizarse conjuntamente con el proceso de la señal de luminancia. En el último caso, cuando una resolución de la señal de color es inferior a la señal de luminancia (por ejemplo, la resolución es a medias en una dirección horizontal y en una dirección vertical), puede controlarse la anchura de región en la señal de luminancia (por ejemplo, a valores pares), o puede determinarse una ecuación de transformación desde la anchura de región de la señal de luminancia hasta la anchura de región de la señal de color. (Proceso de eliminación de ruido de bloques)
No se menciona anteriormente pero, cuando se realiza un proceso de eliminación de ruido de bloques con respecto a una imagen reconstruida, puede realizarse un proceso de eliminación de ruido con respecto a una parte fronteriza de la partición.
A continuación, se describen un programa de codificación predictiva de imágenes que permite que un ordenador funcione como el dispositivo de codificación predictiva de imágenes 100, y un programa de descodificación predictiva de imágenes que permite que un ordenador funcione como el dispositivo de descodificación predictiva de imágenes 200.
La figura 16 es un diagrama que muestra un programa de codificación predictiva de imágenes, así como un medio grabable según una realización. La figura 17 muestra un programa de descodificación predictiva de imágenes, así como un medio de grabación según una realización. La figura 18 es un diagrama que muestra una configuración de hardware de un ordenador para ejecutar un programa grabado en el medio de grabación. La figura 19 es una vista en perspectiva del ordenador para ejecutar el programa almacenado en el medio de grabación.
Tal como se muestra en la figura 16, se proporciona un programa de codificación predictiva de imágenes P100 almacenado en un medio de grabación 10. Tal como se muestra en la figura 17, también se proporciona un programa de descodificación predictiva de imágenes P200 almacenado en el medio de grabación 10. Ejemplos del medio de grabación 10 incluyen medios de grabación tales como discos flexibles, CD-ROM, DVD y ROM; y memorias semiconductoras.
Tal como se muestra en la figura 18, un ordenador 30 está dotado de un dispositivo de lectura 12, tal como una unidad de disco flexible, una unidad controladora de CD-ROM y una unidad controladora de DVD; una memoria de trabajo (RAM) 14 que incluye un sistema operativo residente; una memoria 16 que almacena un programa almacenado en el medio de grabación 10; un dispositivo de visualización 10 tal como una pantalla; un ratón 20 y un teclado 22, siendo los dos dispositivos de entrada; un dispositivo de comunicaciones 24 que transmite y recibe datos, y similares; y una CPU 26 que controla la ejecución del programa. Tras la inserción del medio de grabación 10 en el dispositivo de lectura 12, el ordenador 30 se vuelve accesible para el programa de codificación predictiva de imágenes P100 almacenado en el medio de grabación 10 del dispositivo de lectura 12, y es habilitado por el programa P100 para funcionar como el dispositivo de codificación predictiva de imágenes 100. Adicionalmente, tras la inserción del medio de grabación 10 en el dispositivo de lectura 12, el ordenador 30 se vuelve accesible para el programa de descodificación predictiva de imágenes P200 almacenado en el medio de grabación 10 del dispositivo de lectura 12, y es habilitado por el programa P200 para funcionar como el dispositivo de descodificación predictiva de imágenes 200.
Tal como se muestra en la figura 19, el programa de codificación predictiva de imágenes P100 y el programa de descodificación predictiva de imágenes P200 pueden proporcionarse a través de una red como una señal de datos de ordenador 40 superpuesta sobre una onda portadora. En tal caso, el ordenador 30 almacena en la memoria 16 el programa de codificación predictiva de imágenes P100 o el programa de descodificación predictiva de imágenes P200, que es recibido por el dispositivo de comunicaciones 24, y puede ejecutar el programa P100 o P200.
Tal como se muestra en la figura 16, el programa de codificación predictiva de imágenes P100 está dotado de un módulo de división de bloques P104, un módulo de producción de señales de predicción P106, un módulo de almacenamiento P108, un módulo de resta P110, un módulo de transformación P112, un módulo de cuantización P114, un módulo de cuantización inversa P116, un módulo de transformación inversa P118, un módulo de adición P120 y un módulo de codificación de coeficientes transformados cuantizados P122, un módulo de estimación de información de predicción P126, un módulo de almacenamiento de información de predicción P128, un módulo de decisión P130, un módulo de determinación de anchura de región P134, un módulo de codificación de información de predicción P132, un módulo de determinación de anchura de región P134 y un módulo de codificación de anchura de región P136.
Las funciones realizadas ejecutando cada módulo descrito anteriormente son las mismas que las funciones del dispositivo de codificación predictiva de imágenes 100 descrito anteriormente. Es decir, las funciones de cada módulo del programa de codificación predictiva de imágenes P100 son las mismas que las funciones de la unidad de división de bloques 104, el generador de señales de predicción 106, la memoria de tramas 108, el restador 110, el transformador 112, el cuantizador 114, el cuantizador inverso 116, el transformador inverso 118, el sumador 120, el codificador de coeficientes transformados cuantizados 122, el estimador de información de predicción 126, la memoria de información de predicción 128, la unidad de decisión 130, el codificador de información de predicción 132, el elemento de determinación de anchura de regiones 134 y el codificador de anchura de regiones 136.
El programa de descodificación predictiva de imágenes P200 está dotado de un módulo de análisis de datos P204, un módulo de descodificación de coeficientes transformados cuantizados P214, un módulo de descodificación de información de predicción P216, un módulo de descodificación de anchura de región P218, el módulo de almacenamiento de información de predicción P128, el módulo de decisión P130, un módulo de cuantización inversa P206, un módulo de transformación inversa P208, un módulo de adición P210, el módulo de producción de señales de predicción P106 y el módulo de almacenamiento P108.
Las funciones realizadas ejecutando cada módulo descrito anteriormente son las mismas que las de ca da componente del dispositivo de descodificación predictiva de imágenes 200. Es decir, las funciones de cada módulo del programa de descodificación predictiva de imágenes P200 son las mismas que las funciones del analizador de datos 204, el descodificador de coeficientes transformados cuantizados 214, el descodificador de información de predicción 216, el descodificador de anchura de región 218, la memoria de información de predicción 128, la unidad de decisión 130, el cuantizador inverso 206, el transformador inverso 208, el sumador 210, el generador de señales de predicción 106 y la memoria de tramas 108.
Tal como se ha descrito anteriormente, la presente invención ha sido descrita en detalle basándose en las realizaciones.
Lista de números de referencia
100 dispositivo de codificación predictiva de imágenes
102 terminal de entrada
104 unidad de división de bloques
106 generador de señales de predicción
108 memoria de tramas
110 restador
112 transformador
114 cuantizador
116 cuantizador inverso
118 transformador inverso
120 sumador
122 codificador de coeficientes transformados cuantizados
124 terminal de salida
126 estimador de información de predicción
128 memoria de información de predicción
130 unidad de decisión
132 codificador de información de predicción
134 elemento de determinación de anchura de región
136 codificador de anchura de región
200 dispositivo de descodificación predictiva de imágenes
202 terminal de entrada
204 analizador de datos
206 cuantizador inverso
208 transformador inverso
210 sumador
212 terminal de salida
214 descodificador de coeficientes transformados cuantizados
descodificador de información de predicción
descodificador de anchura de región
Claims (1)
- REIVINDICACIONESProcedimiento de descodificación predictiva de imágenes para un dispositivo de descodificación predictiva de imágenes, comprendiendo el método:una etapa de extracción para extraer, a partir de datos comprimidos en los que una imagen se divide en una pluralidad de regiones y se codifica, datos codificados de información de partición y datos codificados de una señal residual;una etapa de restauración para restaurar la información de partición descodificando los datos codificados de la información de partición que comprende una anchura (w) de una primera partición (R2) de una región de destino (Bt);una etapa de especificación para especificar que la región de destino (Bt) está dividida en la primera partición (R2) y una segunda partición (R1), en el que la primera partición (R2) tiene la anchura (w) comprendida en la información de partición restaurada;una etapa de producción de señales de predicción paraseleccionar una región adyacente (B1) entre una pluralidad de regiones adyacentes que son adyacentes a la región de destino (Bt) basándose en información descodificada a partir de datos codificados de información de identificación para producir una señal de predicción de la primera partición (R2) a partir de una señal reconstruida usando (i) información de modalidad que especifica un procedimiento de predicción inter-imagen, (ii) un número de imagen de referencia y (iii) un vector de movimiento, todos los cuales están asociados a la región adyacente especificada;• cuando la anchura (w) de la primera partición (R2) es igual a una anchura de la región de destino (Bt) y cuando no se usa la información de predicción asociada a una región adyacente (B1), - producir una señal de predicción de la región de destino (Bt) a partir de una señal reconstruida usando:(i) información de modalidad que especifica un procedimiento de predicción inter imagen en la región de destino (Bt),(ii) un número de imagen de referencia y(iii) un vector de movimiento,todos los cuales están asociados a la región de destino (Bt);o• cuando la anchura (w) de la primera partición (R2) es igual a una anchura de la región de destino (Bt) y cuando se usa la información de predicción asociada a una región adyacente (B1), - producir una señal de predicción de la región de destino (Bt) a partir de una señal reconstruida usando:(i) información de modalidad que especifica una predicción inter-imagen en la región de destino (Bt) especificada,(ii) un número de imagen de referencia y(iii) un vector de movimiento,todos los cuales están asociados a la región adyacente (B1) especificada; una etapa de restauración para restaurar una señal residual de reproducción de la región de destino (Bt) a partir de los datos codificados de la señal residual;una etapa de producción de señales de reproducción para producir una señal de reproducción de la región de destino (Bt) basándose en la señal de predicción de la región de destino (Bt) y la señal residual de reproducción; yuna etapa de almacenamiento para almacenar la señal de reproducción de la región de destino (Bt) como la señal reconstruida.Dispositivo de descodificación predictiva de imágenes que comprende:unos medios de extracción para extraer, a partir de datos comprimidos en los que una imagen se divide en una pluralidad de regiones y se codifica, datos codificados de información de partición y datos codificados de una señal residual;unos medios de restauración para restaurar la información de partición descodificando los datos codificados de la información de partición que comprende una anchura (w) de una primera partición (R2) de una región de destino (Bt);unos medios de división para dividir la región de destino (Bt) en la primera partición (R2) y una segunda partición (R1), en el que la primera partición (R2) tiene la anchura (w) comprendida en la información de partición restaurada;unos medios de producción de señales de predicción paraseleccionar una región adyacente (B1) entre una pluralidad de regiones adyacentes que son adyacentes a la región de destino (Bt) basándose en información descodificada a partir de datos codificados de información de identificación para producir una señal de predicción de la primera partición (R2) a partir de una señal reconstruida usando (i) información de modalidad que especifica un procedimiento de predicción inter-imagen, (ii) un número de imagen de referencia y (iii) un vector de movimiento, todos los cuales están asociados a la región adyacente especificada;• cuando la anchura (w) de la primera partición (R2) es igual a una anchura de la región de destino (Bt) y cuando no se usa la información de predicción asociada a una región adyacente (B1), - producir una señal de predicción de la región de destino (Bt) a partir de una señal reconstruida usando:(i) información de modalidad que especifica un procedimiento de predicción inter imagen en la región de destino,(ii) un número de imagen de referencia y(iii) un vector de movimiento,todos los cuales están asociados a la región de destino (Bt);o• cuando la anchura (w) de la primera partición (R2) es igual a una anchura de la región de destino (Bt) y cuando se usa la información de predicción asociada a una región adyacente (B1),- producir una señal de predicción de la región de destino (Bt) a partir de una señal reconstruida usando:(i) información de modalidad que especifica una predicción inter-imagen en la región de destino (Bt) especificada,(ii) un número de imagen de referencia y(iii) un vector de movimiento,todos los cuales están asociados a la región adyacente (B1) especificada; unos medios de restauración de señales residuales para restaurar una señal residual de reproducción de la región de destino (Bt) a partir de los datos codificados de la señal residual;unos medios de producción de señales de reproducción para producir una señal de reproducción de la región de destino (Bt) basándose en la señal de predicción de la región de destino (Bt) y la señal residual de reproducción; yunos medios de almacenamiento para almacenar la señal de reproducción de la región de destino (Bt) como la señal reconstruida.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009069975 | 2009-03-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2964540T3 true ES2964540T3 (es) | 2024-04-08 |
Family
ID=42780818
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19184092T Active ES2964540T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES19184147T Active ES2936295T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES19184146T Active ES2937695T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, programa de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes, procedimiento de descodificación predictiva de imágenes y programa de descodificación predictiva de imágenes |
ES17179305T Active ES2750224T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES19184100T Active ES2935961T3 (es) | 2009-03-23 | 2010-03-16 | Procedimiento de descodificación predictiva de imágenes |
ES19184087T Active ES2936129T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES15185593.9T Active ES2641203T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, programa de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes, procedimiento de descodificación predictiva de imágenes y programa de descodificación predictiva de imágenes |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19184147T Active ES2936295T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES19184146T Active ES2937695T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, programa de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes, procedimiento de descodificación predictiva de imágenes y programa de descodificación predictiva de imágenes |
ES17179305T Active ES2750224T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES19184100T Active ES2935961T3 (es) | 2009-03-23 | 2010-03-16 | Procedimiento de descodificación predictiva de imágenes |
ES19184087T Active ES2936129T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |
ES15185593.9T Active ES2641203T3 (es) | 2009-03-23 | 2010-03-16 | Dispositivo de codificación predictiva de imágenes, procedimiento de codificación predictiva de imágenes, programa de codificación predictiva de imágenes, dispositivo de descodificación predictiva de imágenes, procedimiento de descodificación predictiva de imágenes y programa de descodificación predictiva de imágenes |
Country Status (19)
Country | Link |
---|---|
US (6) | US9031125B2 (es) |
EP (8) | EP3567856B8 (es) |
JP (5) | JP5586101B2 (es) |
KR (7) | KR102032771B1 (es) |
CN (2) | CN102362500B (es) |
AU (7) | AU2010228415B2 (es) |
BR (1) | BRPI1011698B1 (es) |
CA (7) | CA3050573C (es) |
DK (4) | DK3567853T3 (es) |
ES (7) | ES2964540T3 (es) |
FI (5) | FI3567853T3 (es) |
HU (5) | HUE061250T2 (es) |
MX (4) | MX2011009960A (es) |
PL (7) | PL3567856T3 (es) |
PT (7) | PT2988500T (es) |
RU (7) | RU2595754C2 (es) |
SG (2) | SG174323A1 (es) |
TW (7) | TWI517676B (es) |
WO (1) | WO2010110126A1 (es) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3567856T3 (pl) | 2009-03-23 | 2023-03-06 | Ntt Docomo, Inc. | Sposób i urządzenie do predykcyjnego dekodowania obrazu |
RU2619202C1 (ru) * | 2010-07-20 | 2017-05-12 | Нтт Докомо, Инк. | Устройство кодирования изображений с предсказанием, способ кодирования изображений с предсказанием, программа кодирования изображений с предсказанием, устройство декодирования изображений с предсказанием, способ декодирования изображений с предсказанием и программа декодирования изображений с предсказанием |
JP2012095099A (ja) * | 2010-10-27 | 2012-05-17 | Jvc Kenwood Corp | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム |
US8428375B2 (en) * | 2010-11-17 | 2013-04-23 | Via Technologies, Inc. | System and method for data compression and decompression in a graphics processing system |
JP5206772B2 (ja) * | 2010-11-22 | 2013-06-12 | 株式会社Jvcケンウッド | 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム |
JP5206773B2 (ja) * | 2010-11-22 | 2013-06-12 | 株式会社Jvcケンウッド | 動画像復号装置、動画像復号方法及び動画像復号プログラム |
US9060174B2 (en) | 2010-12-28 | 2015-06-16 | Fish Dive, Inc. | Method and system for selectively breaking prediction in video coding |
JP5594841B2 (ja) * | 2011-01-06 | 2014-09-24 | Kddi株式会社 | 画像符号化装置及び画像復号装置 |
JP5781313B2 (ja) * | 2011-01-12 | 2015-09-16 | 株式会社Nttドコモ | 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム |
JP2012205287A (ja) * | 2011-03-28 | 2012-10-22 | Jvc Kenwood Corp | 画像符号化装置、画像符号化方法および画像符号化プログラム |
JP2012205288A (ja) * | 2011-03-28 | 2012-10-22 | Jvc Kenwood Corp | 画像復号装置、画像復号方法および画像復号プログラム |
JP5485969B2 (ja) * | 2011-11-07 | 2014-05-07 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム |
EP4199508A1 (en) | 2011-11-08 | 2023-06-21 | Kabushiki Kaisha Toshiba | Image decoding method and image encoding method |
CN107888913B (zh) * | 2011-12-28 | 2020-05-22 | Jvc 建伍株式会社 | 动图像解码装置以及动图像解码方法 |
JP6045222B2 (ja) * | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
PL2869557T3 (pl) * | 2012-06-29 | 2024-02-19 | Electronics And Telecommunications Research Institute | Sposób i urządzenie do kodowania/dekodowania obrazów |
US9648330B2 (en) * | 2013-07-15 | 2017-05-09 | Qualcomm Incorporated | Inter-color component residual prediction |
US10812796B2 (en) | 2016-09-30 | 2020-10-20 | Lg Electronics Inc. | Image decoding method and apparatus in image coding system |
CN116886896A (zh) | 2017-01-16 | 2023-10-13 | 世宗大学校产学协力团 | 影像解码/编码方法以及传送比特流的方法 |
WO2019190280A1 (ko) * | 2018-03-29 | 2019-10-03 | 세종대학교산학협력단 | 영상 부호화/복호화 방법 및 장치 |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5260783A (en) * | 1991-02-21 | 1993-11-09 | Gte Laboratories Incorporated | Layered DCT video coder for packet switched ATM networks |
KR0166716B1 (ko) * | 1992-06-18 | 1999-03-20 | 강진구 | 블럭 dpcm을 이용한 부호화/복호화방법 및 장치 |
US6285710B1 (en) * | 1993-10-13 | 2001-09-04 | Thomson Licensing S.A. | Noise estimation and reduction apparatus for video signal processing |
JPH07264598A (ja) * | 1994-03-23 | 1995-10-13 | Nippon Telegr & Teleph Corp <Ntt> | 動き補償方法、動きベクトル検出回路および動き補償回路 |
US5608458A (en) * | 1994-10-13 | 1997-03-04 | Lucent Technologies Inc. | Method and apparatus for a region-based approach to coding a sequence of video images |
JPH09182081A (ja) * | 1995-12-25 | 1997-07-11 | Nippon Telegr & Teleph Corp <Ntt> | 動き補償予測符号化装置 |
US5682204A (en) * | 1995-12-26 | 1997-10-28 | C Cube Microsystems, Inc. | Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level |
KR100328416B1 (ko) * | 1996-01-22 | 2002-05-09 | 모리시타 요이찌 | 디지털화상부호화,복호화방법및그것을사용한디지털화상부호화,복호화장치 |
CN100361536C (zh) * | 1996-05-28 | 2008-01-09 | 松下电器产业株式会社 | 图像预测编码/解码装置和方法以及记录媒体 |
EP0817499A3 (en) * | 1996-06-28 | 2002-05-22 | Matsushita Electric Industrial Co., Ltd. | Image coding method using extrapolated pixels in insignificant areas of blocks |
US6687405B1 (en) | 1996-11-13 | 2004-02-03 | Koninklijke Philips Electronics N.V. | Image segmentation |
US6259739B1 (en) | 1996-11-26 | 2001-07-10 | Matsushita Electric Industrial Co., Ltd. | Moving picture variable bit rate coding apparatus, moving picture variable bit rate coding method, and recording medium for moving picture variable bit rate coding program |
US6359929B1 (en) * | 1997-07-04 | 2002-03-19 | Matsushita Electric Industrial Co., Ltd. | Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium |
US6483521B1 (en) * | 1998-02-02 | 2002-11-19 | Matsushita Electric Industrial Co., Ltd. | Image composition method, image composition apparatus, and data recording media |
US7263127B1 (en) * | 1998-04-02 | 2007-08-28 | Intel Corporation | Method and apparatus for simplifying frame-based motion estimation |
JP2000041255A (ja) * | 1998-07-24 | 2000-02-08 | Canon Inc | 動き補償処理方法、動き補償処理回路、符号化装置、及び記憶媒体 |
US6400763B1 (en) * | 1999-02-18 | 2002-06-04 | Hewlett-Packard Company | Compression system which re-uses prior motion vectors |
US6614442B1 (en) * | 2000-06-26 | 2003-09-02 | S3 Graphics Co., Ltd. | Macroblock tiling format for motion compensation |
US6765964B1 (en) | 2000-12-06 | 2004-07-20 | Realnetworks, Inc. | System and method for intracoding video data |
EP1351510A4 (en) | 2001-09-14 | 2008-12-10 | Ntt Docomo Inc | ENCODING METHOD, DECODING METHOD, ENCODING APPARATUS, DECODING APPARATUS, IMAGE PROCESSING SYSTEM, ENCODING PROGRAM, AND DECODING PROGRAM |
EP1445956A4 (en) * | 2001-11-16 | 2009-09-02 | Ntt Docomo Inc | IMAGE ENCODING METHOD, IMAGE DECODING METHOD, ENCODER AND IMAGE DECODER, PROGRAM, COMPUTER DATA SIGNAL, AND IMAGE TRANSMISSION SYSTEM |
JP3861698B2 (ja) | 2002-01-23 | 2006-12-20 | ソニー株式会社 | 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム |
US7003035B2 (en) | 2002-01-25 | 2006-02-21 | Microsoft Corporation | Video coding methods and apparatuses |
KR101011849B1 (ko) * | 2002-04-19 | 2011-01-31 | 파나소닉 주식회사 | 움직임 벡터 계산방법 |
RU2314656C2 (ru) * | 2002-06-11 | 2008-01-10 | Нокиа Корпорейшн | Внутреннее кодирование, основанное на пространственном прогнозировании |
AU2003281133A1 (en) * | 2002-07-15 | 2004-02-02 | Hitachi, Ltd. | Moving picture encoding method and decoding method |
US6728315B2 (en) * | 2002-07-24 | 2004-04-27 | Apple Computer, Inc. | Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations |
JP3504256B1 (ja) * | 2002-12-10 | 2004-03-08 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化方法、動画像復号方法、動画像符号化装置、及び動画像復号装置 |
KR100560843B1 (ko) | 2003-04-10 | 2006-03-13 | 에스케이 텔레콤주식회사 | 비디오 부호기에서 적응 움직임 벡터의 탐색 영역을결정하는 방법 및 장치 |
JP4373702B2 (ja) * | 2003-05-07 | 2009-11-25 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム |
JP2005005844A (ja) * | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 計算装置及び符号化処理プログラム |
JP4968726B2 (ja) * | 2003-06-25 | 2012-07-04 | トムソン ライセンシング | インターフレームのための高速モード決定符号化 |
US20050013498A1 (en) * | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
US8064520B2 (en) | 2003-09-07 | 2011-11-22 | Microsoft Corporation | Advanced bi-directional predictive coding of interlaced video |
US7400681B2 (en) * | 2003-11-28 | 2008-07-15 | Scientific-Atlanta, Inc. | Low-complexity motion vector prediction for video codec with two lists of reference pictures |
JP4213646B2 (ja) * | 2003-12-26 | 2009-01-21 | 株式会社エヌ・ティ・ティ・ドコモ | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。 |
JP3879741B2 (ja) * | 2004-02-25 | 2007-02-14 | ソニー株式会社 | 画像情報符号化装置および画像情報符号化方法 |
JP4313710B2 (ja) | 2004-03-25 | 2009-08-12 | パナソニック株式会社 | 画像符号化方法および画像復号化方法 |
JP4414904B2 (ja) * | 2004-04-16 | 2010-02-17 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム |
US8085846B2 (en) * | 2004-08-24 | 2011-12-27 | Thomson Licensing | Method and apparatus for decoding hybrid intra-inter coded blocks |
KR101108681B1 (ko) | 2005-01-19 | 2012-01-25 | 삼성전자주식회사 | 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법 |
RU2336661C2 (ru) * | 2005-04-19 | 2008-10-20 | Самсунг Электроникс Ко., Лтд. | Способ и устройство адаптивного выбора контекстной модели для кодирования по энтропии |
TWI249907B (en) * | 2005-04-20 | 2006-02-21 | Ind Tech Res Inst | Method for fast mode decision of variable block size coding |
JP2007043651A (ja) * | 2005-07-05 | 2007-02-15 | Ntt Docomo Inc | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム |
US20070025444A1 (en) * | 2005-07-28 | 2007-02-01 | Shigeyuki Okada | Coding Method |
US8446954B2 (en) * | 2005-09-27 | 2013-05-21 | Qualcomm Incorporated | Mode selection techniques for multimedia coding |
JP2007116351A (ja) * | 2005-10-19 | 2007-05-10 | Ntt Docomo Inc | 画像予測符号化装置、画像予測復号装置、画像予測符号化方法、画像予測復号方法、画像予測符号化プログラム、及び画像予測復号プログラム |
CA2631336A1 (en) * | 2005-11-30 | 2007-06-07 | Kabushiki Kaisha Toshiba | Image encoding/image decoding method, image encoding/image decoding apparatus |
WO2007104266A1 (en) * | 2006-03-16 | 2007-09-20 | Huawei Technologies Co., Ltd. | Method and apparatus for realizing adaptive quantization in encoding process |
JP5002286B2 (ja) | 2006-04-27 | 2012-08-15 | キヤノン株式会社 | 画像符号化装置、画像符号化方法、プログラム及び記憶媒体 |
US20080023247A1 (en) * | 2006-07-27 | 2008-01-31 | Hall Mark L | Reverse drive safety system for vehicle |
US20080026729A1 (en) | 2006-07-31 | 2008-01-31 | Research In Motion Limited | Method and apparatus for configuring unique profile settings for multiple services |
JP2009545919A (ja) * | 2006-08-02 | 2009-12-24 | トムソン ライセンシング | ビデオ復号処理のためにアダブティブなジオメトリック分割を行う方法および装置 |
EP2079242A4 (en) | 2006-10-30 | 2010-11-03 | Nippon Telegraph & Telephone | METHOD FOR GENERATING PREDICTIVE REFERENCE INFORMATION, DYNAMIC IMAGE ENCODING AND DECODING METHOD, DEVICE THEREOF, PROGRAM THEREOF, AND STORAGE MEDIUM CONTAINING THE PROGRAM |
KR101383540B1 (ko) * | 2007-01-03 | 2014-04-09 | 삼성전자주식회사 | 복수의 움직임 벡터 프리딕터들을 사용하여 움직임 벡터를추정하는 방법, 장치, 인코더, 디코더 및 복호화 방법 |
US20080240242A1 (en) * | 2007-03-27 | 2008-10-02 | Nokia Corporation | Method and system for motion vector predictions |
JP5666293B2 (ja) * | 2007-04-12 | 2015-02-12 | トムソン ライセンシングThomson Licensing | ビデオ・エンコーディング、およびデコーディングのためのスキップ/ダイレクトモードのコンテクストに依存するマージのための方法と装置 |
JP4788649B2 (ja) * | 2007-04-27 | 2011-10-05 | 株式会社日立製作所 | 動画像記録方法及びその装置 |
JP2008311781A (ja) * | 2007-06-12 | 2008-12-25 | Ntt Docomo Inc | 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム |
JP4947364B2 (ja) * | 2007-06-22 | 2012-06-06 | ソニー株式会社 | 情報処理システムおよび方法、情報処理装置および方法、並びにプログラム |
KR100901874B1 (ko) * | 2007-07-11 | 2009-06-09 | 한국전자통신연구원 | 비디오 인코딩을 위한 인터 모드 결정 방법 |
CA2692782C (en) * | 2007-07-17 | 2013-09-24 | Nippon Telegraph And Telephone Corporation | Video encoding apparatus and method, video encoding program, and storage medium which stores the program |
KR101408698B1 (ko) * | 2007-07-31 | 2014-06-18 | 삼성전자주식회사 | 가중치 예측을 이용한 영상 부호화, 복호화 방법 및 장치 |
JP2009111691A (ja) * | 2007-10-30 | 2009-05-21 | Hitachi Ltd | 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 |
JP4990927B2 (ja) | 2008-03-28 | 2012-08-01 | 三星電子株式会社 | 動きベクトル情報の符号化/復号化方法及び装置 |
JP5406465B2 (ja) | 2008-04-24 | 2014-02-05 | 株式会社Nttドコモ | 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム |
CN102239693B (zh) | 2008-12-03 | 2013-12-18 | 株式会社日立制作所 | 运动图像解码方法和运动图像编码方法 |
PL3567856T3 (pl) | 2009-03-23 | 2023-03-06 | Ntt Docomo, Inc. | Sposób i urządzenie do predykcyjnego dekodowania obrazu |
US9626769B2 (en) | 2009-09-04 | 2017-04-18 | Stmicroelectronics International N.V. | Digital video encoder system, method, and non-transitory computer-readable medium for tracking object regions |
KR101484281B1 (ko) | 2010-07-09 | 2015-01-21 | 삼성전자주식회사 | 블록 병합을 이용한 비디오 부호화 방법 및 그 장치, 블록 병합을 이용한 비디오 복호화 방법 및 그 장치 |
PL2924995T3 (pl) | 2010-07-09 | 2018-11-30 | Samsung Electronics Co., Ltd | Sposób dekodowania wideo wykorzystujący łączenie bloków |
RU2619202C1 (ru) | 2010-07-20 | 2017-05-12 | Нтт Докомо, Инк. | Устройство кодирования изображений с предсказанием, способ кодирования изображений с предсказанием, программа кодирования изображений с предсказанием, устройство декодирования изображений с предсказанием, способ декодирования изображений с предсказанием и программа декодирования изображений с предсказанием |
DK3001686T3 (da) | 2010-10-06 | 2020-03-23 | Ntt Docomo Inc | Indretning, fremgangsmåde og program til biprædiktiv billedafkodning |
KR20120140181A (ko) | 2011-06-20 | 2012-12-28 | 한국전자통신연구원 | 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치 |
EP2787728B1 (en) | 2011-09-23 | 2020-11-11 | KT Corporation | Method for inducing a merge candidate block |
EP3174299B1 (en) * | 2011-11-02 | 2018-09-12 | Tagivan Ii Llc | Video coding method, and video coder |
-
2010
- 2010-03-16 PL PL19184147.7T patent/PL3567856T3/pl unknown
- 2010-03-16 FI FIEP19184092.5T patent/FI3567853T3/fi active
- 2010-03-16 DK DK19184092.5T patent/DK3567853T3/da active
- 2010-03-16 CA CA3050573A patent/CA3050573C/en active Active
- 2010-03-16 SG SG2011065208A patent/SG174323A1/en unknown
- 2010-03-16 CN CN201080013170.3A patent/CN102362500B/zh active Active
- 2010-03-16 KR KR1020197005031A patent/KR102032771B1/ko active IP Right Grant
- 2010-03-16 PL PL19184092.5T patent/PL3567853T3/pl unknown
- 2010-03-16 EP EP19184147.7A patent/EP3567856B8/en active Active
- 2010-03-16 DK DK19184087.5T patent/DK3567852T3/da active
- 2010-03-16 PT PT151855939T patent/PT2988500T/pt unknown
- 2010-03-16 PL PL19184087.5T patent/PL3567852T3/pl unknown
- 2010-03-16 EP EP10755924.7A patent/EP2413605B1/en active Active
- 2010-03-16 FI FIEP19184087.5T patent/FI3567852T3/fi active
- 2010-03-16 CA CA3000726A patent/CA3000726C/en active Active
- 2010-03-16 PL PL19184146.9T patent/PL3567855T3/pl unknown
- 2010-03-16 ES ES19184092T patent/ES2964540T3/es active Active
- 2010-03-16 ES ES19184147T patent/ES2936295T3/es active Active
- 2010-03-16 HU HUE19184087A patent/HUE061250T2/hu unknown
- 2010-03-16 KR KR1020117021010A patent/KR101572462B1/ko active IP Right Grant
- 2010-03-16 EP EP19184100.6A patent/EP3567854B1/en active Active
- 2010-03-16 CA CA2921802A patent/CA2921802C/en active Active
- 2010-03-16 ES ES19184146T patent/ES2937695T3/es active Active
- 2010-03-16 BR BRPI1011698-2A patent/BRPI1011698B1/pt active IP Right Grant
- 2010-03-16 PT PT191841006T patent/PT3567854T/pt unknown
- 2010-03-16 CA CA3050582A patent/CA3050582C/en active Active
- 2010-03-16 HU HUE19184100A patent/HUE061153T2/hu unknown
- 2010-03-16 PT PT191841469T patent/PT3567855T/pt unknown
- 2010-03-16 EP EP19184146.9A patent/EP3567855B1/en active Active
- 2010-03-16 WO PCT/JP2010/054441 patent/WO2010110126A1/ja active Application Filing
- 2010-03-16 EP EP15185593.9A patent/EP2988500B1/en active Active
- 2010-03-16 JP JP2011505988A patent/JP5586101B2/ja active Active
- 2010-03-16 AU AU2010228415A patent/AU2010228415B2/en active Active
- 2010-03-16 DK DK19184147.7T patent/DK3567856T3/da active
- 2010-03-16 PL PL15185593T patent/PL2988500T3/pl unknown
- 2010-03-16 ES ES17179305T patent/ES2750224T3/es active Active
- 2010-03-16 HU HUE19184092A patent/HUE064690T2/hu unknown
- 2010-03-16 RU RU2015108786/08A patent/RU2595754C2/ru active
- 2010-03-16 MX MX2011009960A patent/MX2011009960A/es active IP Right Grant
- 2010-03-16 SG SG10201400802XA patent/SG10201400802XA/en unknown
- 2010-03-16 HU HUE19184146A patent/HUE061249T2/hu unknown
- 2010-03-16 CA CA2756419A patent/CA2756419C/en active Active
- 2010-03-16 ES ES19184100T patent/ES2935961T3/es active Active
- 2010-03-16 ES ES19184087T patent/ES2936129T3/es active Active
- 2010-03-16 HU HUE19184147A patent/HUE061103T2/hu unknown
- 2010-03-16 EP EP17179305.2A patent/EP3249924B1/en active Active
- 2010-03-16 DK DK19184146.9T patent/DK3567855T3/da active
- 2010-03-16 CN CN201410341962.3A patent/CN104065961B/zh active Active
- 2010-03-16 FI FIEP19184147.7T patent/FI3567856T3/fi active
- 2010-03-16 PT PT171793052T patent/PT3249924T/pt unknown
- 2010-03-16 PL PL17179305T patent/PL3249924T3/pl unknown
- 2010-03-16 FI FIEP19184146.9T patent/FI3567855T3/fi active
- 2010-03-16 MX MX2016009255A patent/MX354869B/es unknown
- 2010-03-16 KR KR1020197005032A patent/KR102032772B1/ko active IP Right Grant
- 2010-03-16 KR KR1020157032965A patent/KR101700236B1/ko active IP Right Grant
- 2010-03-16 FI FIEP19184100.6T patent/FI3567854T3/fi active
- 2010-03-16 ES ES15185593.9T patent/ES2641203T3/es active Active
- 2010-03-16 RU RU2011142796/08A patent/RU2549170C2/ru active
- 2010-03-16 KR KR1020177023888A patent/KR101812122B1/ko active IP Right Grant
- 2010-03-16 PL PL19184100.6T patent/PL3567854T3/pl unknown
- 2010-03-16 CA CA3000728A patent/CA3000728C/en active Active
- 2010-03-16 KR KR1020177036233A patent/KR101952726B1/ko active IP Right Grant
- 2010-03-16 EP EP19184092.5A patent/EP3567853B8/en active Active
- 2010-03-16 PT PT191840875T patent/PT3567852T/pt unknown
- 2010-03-16 PT PT191840925T patent/PT3567853T/pt unknown
- 2010-03-16 KR KR1020167027835A patent/KR101773990B1/ko active IP Right Grant
- 2010-03-16 EP EP19184087.5A patent/EP3567852B1/en active Active
- 2010-03-16 PT PT191841477T patent/PT3567856T/pt unknown
- 2010-03-16 CA CA3050583A patent/CA3050583C/en active Active
- 2010-03-16 MX MX2015006350A patent/MX341365B/es unknown
- 2010-03-22 TW TW099108378A patent/TWI517676B/zh active
- 2010-03-22 TW TW107147675A patent/TWI715906B/zh active
- 2010-03-22 TW TW107147849A patent/TWI699113B/zh active
- 2010-03-22 TW TW106130004A patent/TWI654876B/zh active
- 2010-03-22 TW TW105134809A patent/TWI606717B/zh active
- 2010-03-22 TW TW109120081A patent/TWI735257B/zh active
- 2010-03-22 TW TW104133686A patent/TW201603561A/zh unknown
-
2011
- 2011-09-22 MX MX2020011758A patent/MX2020011758A/es unknown
- 2011-09-22 US US13/240,559 patent/US9031125B2/en active Active
-
2014
- 2014-07-18 JP JP2014147639A patent/JP5779270B2/ja active Active
- 2014-12-23 US US14/581,705 patent/US9549186B2/en active Active
-
2015
- 2015-04-17 JP JP2015085249A patent/JP6000398B2/ja active Active
-
2016
- 2016-03-02 AU AU2016201339A patent/AU2016201339B2/en active Active
- 2016-07-06 RU RU2016127198A patent/RU2639662C1/ru active
- 2016-08-30 JP JP2016168204A patent/JP6220023B2/ja active Active
- 2016-11-10 US US15/348,504 patent/US10063855B2/en active Active
-
2017
- 2017-09-28 JP JP2017187567A patent/JP6405432B2/ja active Active
- 2017-11-27 AU AU2017265185A patent/AU2017265185B2/en active Active
- 2017-11-30 RU RU2017141748A patent/RU2672185C1/ru active
-
2018
- 2018-07-11 US US16/032,998 patent/US10284848B2/en active Active
- 2018-07-11 US US16/032,988 patent/US10284847B2/en active Active
- 2018-07-11 US US16/032,985 patent/US10284846B2/en active Active
- 2018-11-02 RU RU2018138742A patent/RU2694239C1/ru active
- 2018-11-02 RU RU2018138744A patent/RU2707713C1/ru active
- 2018-11-02 RU RU2018138743A patent/RU2709165C1/ru active
-
2019
- 2019-07-05 AU AU2019204852A patent/AU2019204852B2/en active Active
- 2019-07-05 AU AU2019204854A patent/AU2019204854B2/en active Active
- 2019-07-05 AU AU2019204856A patent/AU2019204856B2/en active Active
- 2019-07-05 AU AU2019204853A patent/AU2019204853B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2964540T3 (es) | Dispositivo de descodificación predictiva de imágenes y procedimiento de descodificación predictiva de imágenes |