MXPA05000558A - Metodo de acceso aleatorio y renovacion gradual de imagen en codificacion de video. - Google Patents
Metodo de acceso aleatorio y renovacion gradual de imagen en codificacion de video.Info
- Publication number
- MXPA05000558A MXPA05000558A MXPA05000558A MXPA05000558A MXPA05000558A MX PA05000558 A MXPA05000558 A MX PA05000558A MX PA05000558 A MXPA05000558 A MX PA05000558A MX PA05000558 A MXPA05000558 A MX PA05000558A MX PA05000558 A MXPA05000558 A MX PA05000558A
- Authority
- MX
- Mexico
- Prior art keywords
- image
- frame
- region
- random access
- images
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/65—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
- H04N19/66—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving data partitioning, i.e. separation of data into packets or partitions according to importance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Se describe un metodo y aparato asociado para proporcionar acceso aleatorio a y renovacion gradual de, secuencias de video codificadas. La renovacion gradual del descodificador es habilitada por medio del uso de regiones aisladas, orden de macrobloques flexible y apagado de filtro de bucle en fronteras de rebanada. Tambien se proporcionan mecanismos para la deteccion confiable de operaciones deacceso aleatorio y para la senalizacion confiable de cuadros delanteros e imagenes de ODR (renovacion de descodificador abierta).
Description
METODO DE ACCESO ALEATORIO Y RENOVACION GRADUAL DE IMAGEN EN CODIFICACION DE VIDEO
CAMPO DE LA INVENCIÓN La presente invención es concerniente en general con el acceso aleatorio y renovación gradual de imágenes de video. Más específicamente, la invención es concerniente con un método para el acceso - aleatorio y renovación gradual de imágenes de video en secuencias de video codificadas de acuerdo con el estándar de codificación de video I U-T H.264 ISO/IEC MPEG-4 parte 10. ANTECEDENTES DE LA INVENCIÓN Una secuencia de video consiste de una serie de imágenes fijas o cuadros. Los métodos de compresión de video están basados en la reducción de partes redundantes y perceptualmente irrelevantes de secuencias de video. La redundancia en las secuencias de video puede ser clasificada en redundancia espectral, espacial y temporal. La xedundancia espectral se refiere a la similaridad entre los diferentes componentes de color de la misma imagen, en tanto que la redundancia espacial resulta de la similaridad entre pixeles vecinos en una imagen. Existe redundancia temporal debido a que es probable que los objetos que aparecen en una imagen previa también aparezcan en la imagen actual. La compresión puede ser obtenida al tomar ventaja de esta redundancia
Ref.: 161170 temporal y predicción de la imagen actual de otra imagen, denominada una imagen de afianzamiento o imagen de referencia. En la práctica, esto se obtiene al generar datos de compensación de movimiento que describen el movimiento entre la imagen actual y la imagen previa. Los métodos de compresión de video comúnmente diferencian entre imágenes que utilizan reducción de redundancia -temporal y aquellas que no. Las imágenes comprimidas que no utilizan métodos de reducción de redundancia temporal son usualmente llamadas cuadros o imágenes INTRA (o I) . Las imágenes pronosticadas temporalmente son usualmente pronosticadas hacia delante a partir de una imagen que ocurre antes de la imagen actual y son llamadas cuadros INTER o cuadros P. En el caso de cuadros INTER, la imagen compensada en movimiento pronosticada es raramente lo suficientemente precisa y por consiguiente un cuadro de error de predicción comprimido espacialmente es asociado con cada cuadro INTER. Las imágenes INTER pueden contener áreas INTRA-codificadas . Muchos esquemas de compresión de video también usan temporalmente cuadros pronosticados bidireccionalmente, que son denominados comúnmente como imágenes B o cuadros B. Las imágenes B son insertadas entre pares de imagen de afianzamiento de cuadros I- y/o P y son pronosticadas ya sea partir de una o ambas de las imágenes de afianzamiento. Las imágenes B normalmente producen compresión incrementada, en comparación con las imágenes P INTER-codificadas pronosticadas hacia adelante. Las imágenes B no son usadas como imágenes de af anzamiento, esto es, otras imágenes no son pronosticadas a partir de ellas. Por consiguiente, pueden ser descartadas (ya sea intencional o no intencionalmente) sin impactar la calidad de imagen de las imágenes futuras . Mientras que las imágenes B pueden mejorar el desempeño de compresión en comparación con las imágenes B, su generación requiere mayor complejidad de cálculo y uso de memoria e introducen retardos adicionales . Esto puede no ser problema para aplicaciones que no son en tiempo real, tales como flujo de video, pero puede provocar problemas en aplicaciones en tiempo real, tales como videoconferencia . Así, como se explica anteriormente, un segmento de video comprimido consiste comúnmente de una secuencia de imágenes, las cuales pueden ser clasificadas aproximadamente en imágenes INTRA temporalmente independientes, imágenes INTER codificadas temporalmente de manera diferente y (posiblemente) imágenes B predecidas bi-direccionalmente . Puesto que la eficiencia de compresión de las imágenes INTRA-codificadas es normalmente más baja que aquella de las imágenes INTER-codificadas, las imágenes INTRA son usadas escasamente, en especial en aplicaciones de baja velocidad de bits. Sin embargo, debido a que las imágenes INTRA-codificadas pueden ser descodificadas independientes de cualquier otra imagen en la secuencia de video, cada imagen IMTRA representa una entrada (o punto de acceso aleatorio) a la secuencia de video codificada, esto es, un punto desde el cual es puede iniciar la descodificación. Asi, es ventajoso incluir un cierto número de imágenes INTRA-codificadas en una secuencia de video codificada, por ejemplo a intervalos regulares, con el fin de permitir el acceso aleatorio a la secuencia. Además, una secuencia de video típica incluye un número de escenas o tomas . Ya que los contenidos de imagen pueden ser significativamente diferentes de una escena a otra, también es ventajoso codificar la primera imagen de cada nueva escena en formato INTRA. De esta manera, aún si no se incluyen otros cuadros INTRA-codificados en la secuencia codificada, por lo menos el primer cuadro en cada escena proporciona un punto de acceso aleatorio. Cada serie descodificable independientemente de imágenes en una secuencia de video codificada, iniciando con un cuadro INTRA-codificado (que constituye un punto de acceso aleatorio) y que termina en el cuadro inmediatamente precedente al siguiente cuadro INTRA-codificado, es comúnmente denominado como un Grupo de Imágenes o GOP por brevedad. Algunas operaciones de acceso aleatorio son generadas por el usuario final (por ejemplo un observador de la secuencia de video) , por ejemplo como resultado DE que el usuario busca una nueva posición en un archivo de video transferido. En este caso, es probable que el descodificador obtenga una indicación de una operación de acceso aleatorio generadar por el usuario y puede actuar de conformidad. Sin embargo, en algunas situaciones, las operaciones de acceso aleatorio no son controladas por el usuario final . Por ejemplo, un flujo rebanado o editado puede contener "cortes" en el flujo codificado con características similares a las operaciones de acceso aleatorio llevadas a cabo por un usuario. Sin embargo, en este último caso el descodificador puede no recibir una indicación de que tal corte ha ocurrido y puede no ser apto de descodificar imágenes subsecuentes en la secuencia correctamente. Por consiguiente, es importante que se proporcione un descodificador de video con un método confiable para detectar operaciones de acceso aleatorio o cortes en un flujo de video codificado. Los estándares de codificación de video modernos definen una sintaxis para una flujo de bits de video autosuficiente . Los estándares más populares al tiempo de redacción son International Telecommunications Union ITU-T Recommendation H-263, "Video coding for low bit rate communication" , febrero de 1998; International Standards Organization/International Electro-technical Commission
ISO/IEC 14496-2, "Generic Coding of Audio-Visual Objects. Parte 2: Visual", 1999 (conocido como MPEG-4) e ITU-T Recommendation H.262 (ISO/lEC 13818-2) (conocido como PEG-2) .
Estos estándares definen una jerarquía para los flujos de bits y correspondientemente para secuencias de imágenes e imágenes . El desarrollo de estándares de codificación de video adicionales está todavía en marcha. En particular, ahora se llevan a cabo esfuerzos de estandarización en el desarrollo de un sucesor a largo plazo para H.263, conocido como ITU-T H.264 ] ISO/IEC MPEG- parte 10, conjuntamente bajo los auspicios de un cuerpo de estandarización conocido como el Equipo de Video Unido (JVT) de ISO/IEC MPEG (Grupo de Expertos de Imágenes en Movimiento) y ITU-T VCEG (Grupo de Expertos de Codificación de Video) . Algunos aspectos particulares de estos estándares y en particular aquellos aspectos del estándar de codificación de video H.264 relevantes para la presente invención son descritos a continuación. La figura 1 ilustra una secuencia de imágenes codificadas convencional, que comprende imágenes I INTRA-codificadas, imágenes P INTER-codificadas e imágenes B codificadas bidireccionalmente arregladas en un patrón- que tiene la forma I B B P.. etc. Los bloques indican cuadros en orden de presentación, las flechas indican compensación de movimiento, las letras en los bloques indican tipos de cuadro y los valores en los bloques son números de cuadro (como se especifica de acuerdo con el estándar de codificación de video H.264), que indican el orden de codificación/descodificación de los cuadros .
El término "cuadro delantero" o "imagen delantera" es usada para describir cualquier cuadro o imagen que no puede ser descodificado correctamente después de tener acceso al cuadro I previo y cuyo tiempo de presentación es antes del tiempo de presentación del cuadro I . (Los cuadros B B17 en la figura 1 son ejemplos de cuadros delanteros) . En esta descripción, el término imagen de "renovación de descodificador abierta" (ODR, por sus siglas en inglés) es usado para denotar un cuadro accesible aleatoriamente con imágenes delanteras. Patrones de cuadro codificados similares a aquel mostrado en la figura 1 son comunes y así es deseable hacer acceso aleatorio a imágenes ODR tan fácil como sea posible. Ya existen un número de alternativas para tener acceso a imágenes ODR. Una solución típica es simplemente descartar cualesquier imágenes B delanteras . Este es el procedimiento adoptado comúnmente en los estándares de codificación de video que no permiten selección de imagen de referencia y desacoplamiento de descodificación y orden de presentación, en donde una imagen I es siempre un punto de acceso aleatorio. Otra solución al problema es considerar todos los cuadros no almacenados que siguen inmediatamente un cuadro I (en orden de codificación/descodificación) como cuadros delanteros. En tanto que este procedimiento trabaja en el caso simple ilustrado en la figura 1, carece de la propiedad de manejar cuadros delanteros almacenados. Un ejemplo de un esquema de codificación en el cual hay un cuadro delantero almacenado antes de un cuadro I accesible aleatoriamente es mostrado en la figura 2. La identificación implícita simple de cuadros delanteros, recién descrita, no traba a correctamente en este ejemplo. Una idea directa adicional es considerar todas las imágenes B que ocurren después de un cuadro I (en orden de codificación/descodificación) como imágenes delanteras. Sin embargo, las imágenes delanteras pueden no ser siempre imágenes B. Por ejemplo, el artículo científico de Miska M. Hannuksela, intitulado: "Simple Packet Loss Recovery Method for Video Streaming" , Proceedings of Packet Video Workshop 2001, Kyongju, South Korea, abril 20 - mayo 1, 2001 e ITU-T SG16/Q15 documento Q15-K38 proponen un método de postergación de INTRA-cuadro por resiliencia de error mejorada en codificación de video, la adopción del cual vuelve este método simple para la identificación de cuadros delanteros no trabajables. La figura 3 muestra un ejemplo de un cuadro INTRA postergado por un intervalo de cuadro almacenado. Consecuentemente, hay un cuadro P (P17) precedente al cuadro INTRA en orden de presentación. El documento de JVT JVT-B063 propone que un cuadro puede ser asociado con un retardo de inicialización (provisto en el flujo de bits de video como información de Mejora Complementaria) que indica cuanto toma para todos los cuadros subsecuentes en orden de presentación para ser completamente correctos en contenido después de iniciar la descodificación de un cuadro particular. Esta información de SEI de retardo de inicialización puede ser usada cuando se tiene acceso a imágenes ODR. Sin embargo, hay tres desventajas asociadas con este procedimiento. En primer lugar, el proceso del descodificador para manejar mensajes SEI es no normativo, esto es, no es una parte determinante del estándar H.264 y por consiguiente no tiene que ser soportado por todos los descodificadores implementados de acuerdo con H.2G4. Así, podría haber un descodificador, no conciente de SEI, que cumple con el estándar, que hace acceso a un flujo que cumple con el estándar aleatoriamente pero falla en descodificarlo debido a cuadros de referencia ausentes para imágenes delanteras. En segundo lugar, el descodificador puede descodificar algunos datos, tales como cuadros delanteros almacenados, innecesariamente ya que no sabe que no son útiles para la operación de renovación. En tercer lugar, la operación del descodificador para referirse a números de cuadro faltantes se vuelve más complicada. Consecuentemente, este procedimiento no es preferido como solución al acceso aleatorio de imágenes ODR. El estándar de codificación de video H.264 (como se especifica en el borrador del comité de JVT) incluye los conceptos de "renovación de descodificador instantánea" (GDR, por sus siglas en inglés) . Esto se refiere a una forma del llamado acceso aleatorio "sucio" , en donde se hace referencia a datos previamente codificados pero posiblemente no recibidos y el contenido de imagen correcto es recuperado gradualmente en más de una imagen codificada. GDR permite capacidades de acceso aleatorio utilizando cualquier tipo de cuadro. Un mecanismo de señalización para GDR fue propuesto por primera vez en el documento de JV JVT-B063 (y luego en el documento de salida JVT JVT-B109) . JVT-B063 concluyó que hay básicamente dos alternativas fundamentales para inicializar el proceso de descodificación de GDR, "descodificación de mejor esfuerzo" y "descodificación asegurada". En la descodificación de mejor esfuerzo todos los cuadros no disponibles son inicializados a gris de medio nivel y la descodificación de todos los cuadros es iniciada pero son considerados completamente correctos en contenido solamente después que se satisfacen ciertas condiciones indicadas . En la "descodificación asegurada" el descodificador inicia la descodificación de un cuadro I y luego espera antes de intentar descodificar cualesquier más cuadros que no son I, para asegurar que los cuadros restantes no contengan referencias a datos no disponibles. La alternativa del mejor esfuerzo fue preferida en JVT-B063. Cuestiones concernientes con la codificación de renovación de descodificador gradual fueron estudiadas en el documento de JVT JVT-C074. Este documento concluyó que GDR era imposible - de realizar utilizando la versión del codee JVT H.246 válida en aquel tiempo y propuso que se debe usar un método conocido como la "técnica de región aislada" (IREG) para la codificación de GDR. La técnica de región aislada fue propuesta en el documento JVT JVT-C072. Una región aislada es un área sólida de macrobloques , que definen la forma de la frontera a través de la cual la filtración de bucle debe ser apagada y a la cual la predicción en imagen espacial es limitada. La predicción temporal fuera de regiones aisladas en cuadros de referencia debe ser deshabilitada. La forma de una región aislada puede evolucionar durante un número de imágenes codificadas consecutivas. El grupo de imágenes (GOP) , dentro de las cuales la forma de una región aislada depende de la forma de la región aislada correspondiente en una imagen previa y que incluye la imagen que contiene la región aislada inicial codificada sin predicción temporal, es denominada como un "grupo de imágenes con regiones aisladas evolucionarías" (IREG GOP) . El período correspondiente (en términos de cuadros de referencia codificados) es llamado el "período de regiones aisladas evolucionarlo" o "período IREG" . Como se menciona anteriormente, IREG proporciona una solución elegante para habilitar la funcionalidad GDR y puede también ser usado para proporcionar resiliencia de error y recuperación (véase documento de JVT JVT-C073) , codificación de región de interés y prioritización, funcionalidad de imagen en imagen y codificación de transiciones de escenas de video enmascaradas (véase documento JVT-C075) . El acceso aleatorio gradual basado en IREG, permite conmutación de canal de medios para receptores, conmutación de flujo de bits para un servidor y permite además fácil acceso de novedades en aplicaciones de flujo de multidifusión. La propiedad de resiliencia de error mejorada y la propiedad de renovación de descodificador gradual de regiones aisladas son aplicables al mismo tiempo. Así, cuando un codificador usa regiones aisladas para obtener renovación de descodificador gradual, obtiene resiliencia de error mejorada "gratis" sin velocidad de bits adicional o costo de complejidad y viceversa. Un concepto adicional incluido en el estándar de codificación de video H.264 es aquel de "orden de macrobloque flexible" (FMO) . El FMO fue propuesto por primera vez en la contribución de JVT JVT-C089 y luego fue incluido en el borrador del comité de JVT del estándar H.264. Al repartir imágenes en grupos de rebanadas, FMO permite la codificación de macroblogues en un orden diferente a aquel del orden de barrido de trama típico. La aplicación clave habilitada por este mecanismo es la implementación de métodos de resiliencia de error, tales como rebanadas dispersadas (véase documento JVT JVT-C090) e intercalado de rebanadas (como se propone en el documento JVT JVT-C091) . Debido a su flexibilidad, otras aplicaciones de orden de macrobloque flexible son también posibles. El documento JVT JVT-D095 propone unas pocas mejoras al FMO. El apagado del filtro de bucle en las fronteras de rebanada fue propuesto en el documento JVT-C117 para mejorar la resiliencia de error y para soportar la GD perfecta. Esta limitación de filtro de bucle tiene dos ventajas adicionales: en primer lugar proporciona una buena solución al problema de procesamiento paralelo inherente en la técnica de FMO y en segundo lugar es necesaria para permitir la descodificación correcta de rebanadas en el tiempo fuera de orden. BREVE DESCRIPCIÓN DE LA INVENCIÓN La presente invención' introduce nuevos métodos para implementar acceso aleatorio y renovación gradual de imágenes en secuencias de video codificadas. Se integra, en particular, en los métodos de renovación de descodificador gradual propuestos durante el desarrollo del estándar de codificación de video H.264 y propone una implementación práctica para GDR en el contexto del codee de video H.264. Sin embargo, se debe apreciar que la invención no está de ninguna manera limitada a aplicación en los confines del estándar H.264 y puede ser aplicada en otros estándares de codificación de video en los cuales secuencias de video son codificadas usando una combinación de cuadros INTRA e INTER codificados y que emplea una sintaxis que es similar a aquella usada en H.264. Más específicamente, la presente invención propone una implementación de renovación de descodificador gradual habilitada al usar regiones aisladas, orden de macrobloque flexible y apagado de filtro de bucle en fronteras de rebanada. En particular, la invención adapta la técnica de región aislada original de JVT-C072 para inclusión en el estándar de codificación de video H.264 e introduce un método de señalización para renovación de descodificador gradual. La invención también propone un mecanismo para la detección confiable de operaciones de acceso aleatorio. También propone mecanismos para la señalización confiable de cuadros delanteros e imágenes de ODR. BREVE DESCRIPCIÓN DE LAS FIGURAS La figura 1 ilustra un patrón de cuadro I B B P codificado y muestra la ubicación de cuadros B delanteros; La figura 2 muestra un cuadro I accesible aleatoriamente con cuadros delanteros almacenados ; La figura 3 ilustra la técnica de postergación de cuadro INTRA y La figura 4 ilustra el orden de crecimiento de evolución de forma en la dirección de las manecillas del reloj, fuera de bloque, de acuerdo con la presente invención.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Ahora se describirá una implementación práctica de renovación de descodificador gradual de acuerdo con la presente invención. Como se menciona previamente en los antecedentes de la invención, el apagado de filtración de bucle en fronteras de rebanada es ventajoso para la implementación de renovación de descodificador gradual. En particular, la filtración de bucle a través del borde de un área renovada debe ser apagada con el fin de evitar una desadaptación de valor de pixel en la descodificación normal y durante la descodificación después de acceso aleatorio. La renovación de descodificador gradual sin la limitación de filtro de bucle (esto es, con filtración de bucle todavía habilitada) es- posible no son muy probables las desadaptaciones molestas; sin embargo, es difícil controlar la amplitud y propagación de desadaptaciones, de tal manera que es preferible apagar el filtro de bucle. Por consiguiente, la presente invención propone que la filtración de bucle esté limitada de tal manera que las fronteras de rebanada sean manejadas como fronteras de imagen. Esta limitación puede ser señalada en una base de imagen por imagen. Más específicamente, de acuerdo con una modalidad preferida de la invención, si un macrobloque y el macrobloque vecicno a su izquierda pertenecen a rebanadas diferentes, el macrobloque es filtrado como si estuviera en la frontera de imagen izquierda.
Si un macrobloque y el macrobloque vecino por encima del mismo pertenecen a rebanadas diferentes, entonces el macrobloque es filtrado como si estuviera en la hilera superior de macrobloques en la imagen. La invención introduce además el concepto de un "grupo de rebanadas" para uso en relación con renovación de descodificador gradual. De acuerdo con la invención, un grupo de rebanadas es definido como un grupo de rebanadas que cubre una cierta región de una imagen, el tamaño de cada rebanada dentro del grupo es ajustable independientemente. Ventajosamente, el tamaño codificado de una rebanada es ajustado de acuerdo con el tamaño de paquete de transporte preferido. Un grupo de rebanadas, como se define de acuerdo con la presente invención, es ideal para implementación de renovación de descodificador gradual usando el procedimiento de región aislada (como se introduce por el documento JVT JVT-C072 y descrito anteriormente en el texto) . En particular, una región aislada cubre una cierta área espacial, que puede contener más de una rebanada y sus fronteras deben ser procesadas de una manera similar a las fronteras de rebanada (en particular, filtración de bucle e INTRA predicción deben ser apagadas) . Cuando se usa para implementar renovación de descodificador gradual, la forma, tamaño y ubicación de una región aislada evolucionan, debido a que el área renovada gradualmente comúnmente crece de imagen en imagen. En tanto que tal evolución de forma podría ser transportada con la sintaxis PMO del estándar de codificación de video H.264, un número significativo de bits pueden ser ahorrados cuando se define una sintaxis de F O específica para formas evolucionarías . De acuerdo con la invención, la información de forma y posición de regiones aisladas en cuadros consecutivos es almacenada. Esta información es usada en la estimación de movimiento. La manera en la cual se efectúa la estimación/compensación de movimiento también es modificada con el fin de facilitar el uso de regiones aisladas. En particular, cuando se lleva a cabo estimación de movimiento de pleno pixel, los vectores de movimiento referentes al exterior de las regiones aisladas en cuadros de referencia correspondientes son descartados sin calcular los costos de codificación. También son necesarias medidas especiales cuando se lleva a cabo estimación/compensación de movimiento a una resolución de pixel no entero. El estándar de codificación de video H.264 permite la estimación/compensación de movimiento a la exactitud de 1/4 o 1/8 de pixel. Se usan diferentes filtros de interpolación para interpolar los sub-pixeles de 1/4 y 1/8. Para la exactitud de 1/4 de pixel, posiciones de 1/2 muestra son interpoladas usando filtración de 6 derivaciones y las posiciones de 1/4 de muestra son interpoladas al promediar las dos muestras más cercanas en la posición de una muestra entera o 1/2 muestra. Hay una excepción a esta regla general, conocida como la "posición divertida" , que es obtenida al promediar las cuatro muestras de enteros más cercanas. Como resultado del proceso de interpolación, ciertas regiones "abandonadas" afectan los sub-pixeles residentes al interior pero menos de 2 pixeles enteros alejados de la frontera de una región aislada. De acuerdo con la invención, este hecho es tomado en cuenta cuando se lleva a cabo la estimación de movimiento a resolución de sub-pixel . Más específicamente, los vectores de movimiento que se refieren a bloques más cercanos que dos pixeles alejados de la frontera de una región aislada son descartados sin calcular los costos de codificación. Una operación similar se lleva a cabo cuando se usa la resolución de pixel de 1/8 para la estimación/compensación de movimiento. Como se explica anteriormente, cuando se lleva a cabo la renovación de descodificador gradual usando regiones aisladas, las regiones aisladas evolucionan en tamaño, forma y ubicación. Finalmente, como resultado ¦ 'del proceso de renovación de descodificador gradual, se obtiene un cuadro confiable (esto es, completamente reconstruido) . Esto se obtiene cuando una región aislada evoluciona para volverse igual a un cuadro entero (esto es, cubre toda el área de imagen) . De acuerdo con la invención, una vez que se ha alcanzado esta situación, se imponen las siguientes limitaciones sobre la codificación de cuadros subsecuentes: 1. Las nuevas regiones aisladas deben evitar predicción del GOP de IREG previo; 2. Para regiones abandonadas, se debe evitar la predicción que se refiere a las regiones abandonadas en cuadros antes del cuadro confiable y que se refiere a cualquier bloque en cuadros temporalmente antes del GOP de IREG previo. Limitaciones de cuadro de referencia apropiados y limitaciones de vector de movimiento similares a aquellas descritas anteriormente son aplicadas con el fin de cumplir con estos dos requerimientos . En cuadros en donde se usa la técnica de GDR que utiliza regiones aisladas implementadas de acuerdo con la invención, cada imagen contiene una región aislada y una región abandonada. La región aislada es un grupo de rebanadas y la región abandonada es otro grupo de rebanadas. Las formas de región de los dos grupos de rebanadas evolucionan y siguen la evolución de la región aislada de imagen en imagen, de acuerdo con la velocidad de crecimiento de la región señalada.
La presente invención introduce además sintaxis adicional para ser incluida en el estándar de codificación de video H.2S4 para permitir la señalización de regiones aisladas. Más específicamente, de acuerdo con la invención, algunos nuevos mb_allocation_map_types son agregados a la sintaxis del estándar H.264. Estos son mostrados a continuación en la tabla 1, en donde los elementos de sintaxis agregados introducidos con el fin de soportar regiones aisladas son denotados por "IREG" en la columna derecha y "RECT" denota grupos de rebanadas rectangulares (como se propone en JVT-D095) : Tabla 1 : Sintaxis para soportar regiones independientes de acuerdo con la invención
En la tabla 1, el parámetro num_slice_groups_minusl es ajustado a 1 cuando el mb_allocation_map_type es 4, 5 o 6 (esto es, hay solamente dos grupos de rebanadas en la imagen) . El parámetro growth_rate representa el número de macrobloques por los cuales una región aislada crece por imagen. Usando el parámetro velocidad de crecimiento y conociendo el tamaño de una imagen a ser renovada, un descodificador puede determinar el tiempo requerido para renovar completamente toda la imagen (conocido como el periodo GDR) . Por ejemplo, en el caso de imágenes QCIF (que comprenden 99 macrobloques de 16 x 16 pixeles en un arreglo rectangular de 11 x 9) y una velocidad de crecimiento de 10 macrobloques por imagen, la obtención de una imagen plenamente renovada toma el techo (99/10) = 10 imágenes desde el inicio del periodo GDR (inclusive) . El nuevo mb_allocation_map_types 4, 5, 6 y direcciones de evolución definidos de acuerdo con la invención y presentados en la tabla 1 definen seis patrones de evolución de grupo de rebanadas para regiones aisladas, como se muestra a continuación en la tabla 2. Tabla 2 : Nuevos parámetros de evolución de grupo de rebanadas de acuerdo con la invención
Los seis patrones de evolución de región presentados en la tabla 2 son definidos como sigue: 1. Barrido de trama: El primer macrobloque de la región aislada es el macroblogue superior izquierdo de la imagen. La región aislada crece en orden de barrido de trama. 2. Barrido de trama inverso : El primer macrobloque de la región aislada es el macroblogue inferior derecho de la imagen. La región aislada crece en orden de barrido de trama inverso. 3. Enjugón derecho. El primer macrobloque de la región aislada es el macrobloque superior izquierdo de la imagen. La región aislada crece de arriba abajo. El siguiente macrobloque después del macrobloque más del fondo de una columna es el macrobloque superior de la columna del lado derecho de la columna previa. 4. Enjugón izquierdo. El primer macrobloque de la región aislada es el macrobloque inferior derecho de la imagen. La región aislada crece de abajo -hacia arriba. El siguiente macrobloque después del macrobloque de lo más alto de una columna es el macrobloque del fondo de la columna en el lado izquierdo de la columna previa. 5. Encuadrado en la dirección de las manecillas del reloj: Utilizando un sistema de coordenadas (x, y) con su origen en el macrobloque superior izquierdo y que tiene granularidad de macrobloque y usando H para denotar el número de hileras de macrobloques codificados en la imagen y W para denotar el número de columnas de macrobloques codificados de la imagen, el primer macrobloque de la región aislada es el macrobloque que tiene coordenadas (xO, yO) = ( /2, H2) , "/" denota división por truncamiento. El orden de crecimiento de la región aislada es definido como se muestra en la figura 4 de los dibujos adjuntos. 6. Encuadrado en la dirección contraria de las manecillas del reloj : Usando las mismas definiciones de sistema de coordenadas, variables y la operación aritmética como se introduce en 5 anteriormente, el primer macrobloque de la región aislada es el macrobloque que tiene coordenadas ( O , yO) = (( -D/2, (H-D/2). El orden de crecimiento es similar a aquel mostrado en la figura 4 pero en la dirección contraria a las manecillas del reloj . Con el fin de permitir que los descodificadores , unidades de edición de dominio codificado y elementos de red distingan un punto de acceso aleatorio fácilmente, una modalidad preferida de la presente invención propone que el inicio de un período GDR sea señalado en el tipo de unidad de Capa de Adaptación de Red (NAL) de la sintaxis H.264. La primera imagen de un período de GDR es llamada una imagen GDR. No se requiere una sintaxis precisa, pero una sintaxis ej emplar que podría ser usada se puede encontrar en el borrador del trabajo de JV -C074. La presente invención también propone mecanismos para la indicación confiable de imágenes ODR y cuadros delanteros. De una manera similar a aquella descrita en relación con la señalización de una imagen GDR, la invención propone que se proporcione una imagen ODR con un tipo de unidad NAL especializad . Además, en una modalidad preferida de la invención, cuadros delanteros son marcados explícitamente. Este procedimiento es preferido debido a que no impone restricciones o complicaciones en las implementaciones del codificador y proporciona un mecanismo mediante el cual los descodificadores pueden identificar fácilmente cuadros delanteros. De acuerdo con la invención, las imágenes delanteras pueden ser cualesquier imágenes compensadas en movimiento, esto es, imágenes P, B y SP (el tipo de imagen SP es un tipo especial de imagen compensada en movimiento, definida de acuerdo con H.264). Ventajosamente, una bandera (denominada una leading_picture_flag) es asociada con estos tipos de imagen y es agregada en la sintaxis de tipo unidad NAL H.264 o en la imagen o sintaxis de encabezado de rebanada, con el fin de proporcionar una indicación explícita de que una imagen dada es una imagen delantera. Esta opción es particularmente ventajosa, ya que involucra muy pocos gastos o sin gastos de velocidad de bits y es fácil de usar tanto por los codificadores como los descodificadores . De acuerdo con la invención, los puntos de acceso aleatorio son indicados usando el "identificador de sub-secuencia" como se presenta en el documento JVT JVT-D098.
La sintaxis precisa par la señalización de imágenes GDR u ODR e imágenes delanteras puede variar de acuerdo con los detalles de la sintaxis tipo unidad NAL adoptada en el estándar de codificación de video H.264. Una imagen ODR definida de acuerdo con la invención tiene las siguientes características: 1. El proceso de descodificación puede ser iniciado o reiniciado después de una operación de acceso aleatorio de una imagen ODR. 2. Una imagen ODR contiene solamente rebanadas I o SI;
3. La unidad NAL de ODR contiene una rebanada EBSP y . El tipo de unidad NAL de ODR es usado para todas las unidades NAL que contienen datos de macrobloque codificados de una imagen ODR. Una imagen GDR definida de acuerdo con la invención tiene .las siguientes características: 1. El proceso de descodificación puede ser iniciado o reiniciado después de una operación de acceso aleatorio de una imagen GDR; 2. Una imagen GDR puede ser codificada con cualquier tipo de codificación. 3. El tipo de unidad NAL de GDR es usado para todas las unidades NAL que contienen datos de macrobloque codificados de una imagen GDR. De acuerdo con la invención, la leading_picture_flag asociada con una imagen delantera tiene las siguientes características : 1. La leading_picture_flag señala una imagen que no será descodificada si el proceso de descodificación fue iniciado de una imagen ODR previa en el orden de descodificación y una imagen IDR ocurrió en el orden de descodificación entre la imagen actual y la imagen ODR. 2. La leading_picture_flag permite acceso aleatorio a una imagen ODR que es usada como referencia de compensación de movimiento por imágenes temporalmente previas en orden de presentación, sin descodificar aquellos cuadros que no pueden ser reconstruidos correctamente si la imagen ODR es accesada aleatoriamente . Los siguientes cambios en el proceso de descodificación H.264 resultan de la adopción de imágenes ODR y GDR y los mecanismos para señalización de puntos de acceso aleatorio y cuadros delanteros como se define de acuerdo con la presente invención: 1. Si el identificador de sub-secuencia de una imagen GDR u ODR es diferente del identificador de sub-secuencia recibido previo, el descodificador infiere una operación de renovaciónde GDR u ODR y el índice de cuadro a largo plazo máximo es restablecido a 0. 2. Si una operación de ODR iniciada de una imagen de ODR y si ninguna imagen de ODR o IDR fue descodificada desde la imagen de ODR inicial, una imagen que tiene una leading_picture_flag igual a wl" no es descodif cada. 3. Si una operación de GDR iniciada de una imagen de GDR, el descodificador no descodifica ninguna región abandonada y no interfiere una pérdida de datos si no se recibe una región abandonada. Se hace constar que, con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente invención.
Claims (1)
1.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39620002P | 2002-07-16 | 2002-07-16 | |
PCT/US2003/022262 WO2004008735A2 (en) | 2002-07-16 | 2003-07-16 | A method for random access and gradual picture refresh in video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA05000558A true MXPA05000558A (es) | 2005-04-19 |
Family
ID=30115983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA05000558A MXPA05000558A (es) | 2002-07-16 | 2003-07-16 | Metodo de acceso aleatorio y renovacion gradual de imagen en codificacion de video. |
Country Status (11)
Country | Link |
---|---|
US (1) | US8300690B2 (es) |
EP (2) | EP3177020B1 (es) |
JP (2) | JP2005533444A (es) |
KR (1) | KR100754419B1 (es) |
CN (3) | CN1669321A (es) |
AU (1) | AU2003251964A1 (es) |
BR (1) | BR0312657A (es) |
CA (1) | CA2492751C (es) |
HK (1) | HK1123653A1 (es) |
MX (1) | MXPA05000558A (es) |
WO (1) | WO2004008735A2 (es) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6307487B1 (en) | 1998-09-23 | 2001-10-23 | Digital Fountain, Inc. | Information additive code generator and decoder for communication systems |
US7068729B2 (en) * | 2001-12-21 | 2006-06-27 | Digital Fountain, Inc. | Multi-stage code generator and decoder for communication systems |
KR100603592B1 (ko) * | 2001-11-26 | 2006-07-24 | 학교법인 고황재단 | 영상 화질 향상 인자를 이용한 지능형 파문 스캔 장치 및 그 방법과 그를 이용한 영상 코딩/디코딩 장치 및 그 방법 |
US9240810B2 (en) * | 2002-06-11 | 2016-01-19 | Digital Fountain, Inc. | Systems and processes for decoding chain reaction codes through inactivation |
CN100539439C (zh) * | 2002-10-05 | 2009-09-09 | 数字方敦股份有限公司 | 连锁反应码的系统编码和解码系统和方法 |
US20040260827A1 (en) * | 2003-06-19 | 2004-12-23 | Nokia Corporation | Stream switching based on gradual decoder refresh |
US8249113B2 (en) * | 2004-03-19 | 2012-08-21 | Broadlogic Network Technologies, Inc. | Method and system for providing faster channel switching in a digital broadcast system |
CN103124182B (zh) * | 2004-05-07 | 2017-05-10 | 数字方敦股份有限公司 | 文件下载和流系统 |
KR100982518B1 (ko) * | 2004-06-11 | 2010-09-16 | 삼성전자주식회사 | 영상 데이터 유닛의 dc 계수 예측 방법 및 그 장치 |
JP4680608B2 (ja) * | 2005-01-17 | 2011-05-11 | パナソニック株式会社 | 画像復号装置及び方法 |
US7697783B2 (en) * | 2005-07-26 | 2010-04-13 | Sony Corporation | Coding device, coding method, decoding device, decoding method, and programs of same |
US8229983B2 (en) * | 2005-09-27 | 2012-07-24 | Qualcomm Incorporated | Channel switch frame |
NZ566935A (en) * | 2005-09-27 | 2010-02-26 | Qualcomm Inc | Methods and apparatus for service acquisition |
US9467659B2 (en) * | 2005-09-27 | 2016-10-11 | Qualcomm Incorporated | Method and apparatus for progressive channel switching |
KR100770872B1 (ko) * | 2006-02-17 | 2007-10-26 | 삼성전자주식회사 | 디지털 멀티미디어 방송 시스템에서 채널 전환 시간 단축을위한 데이터 수신장치 및 방법 |
US9270414B2 (en) * | 2006-02-21 | 2016-02-23 | Digital Fountain, Inc. | Multiple-field based code generator and decoder for communications systems |
US7971129B2 (en) | 2006-05-10 | 2011-06-28 | Digital Fountain, Inc. | Code generator and decoder for communications systems operating using hybrid codes to allow for multiple efficient users of the communications systems |
US9380096B2 (en) | 2006-06-09 | 2016-06-28 | Qualcomm Incorporated | Enhanced block-request streaming system for handling low-latency streaming |
US9209934B2 (en) | 2006-06-09 | 2015-12-08 | Qualcomm Incorporated | Enhanced block-request streaming using cooperative parallel HTTP and forward error correction |
US9178535B2 (en) * | 2006-06-09 | 2015-11-03 | Digital Fountain, Inc. | Dynamic stream interleaving and sub-stream based delivery |
US9432433B2 (en) * | 2006-06-09 | 2016-08-30 | Qualcomm Incorporated | Enhanced block-request streaming system using signaling or block creation |
US20100211690A1 (en) * | 2009-02-13 | 2010-08-19 | Digital Fountain, Inc. | Block partitioning for a data stream |
US9419749B2 (en) | 2009-08-19 | 2016-08-16 | Qualcomm Incorporated | Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes |
US9386064B2 (en) | 2006-06-09 | 2016-07-05 | Qualcomm Incorporated | Enhanced block-request streaming using URL templates and construction rules |
US8077626B2 (en) | 2006-07-14 | 2011-12-13 | Qualcomm Incorporated | Quality of service (QoS) aware establishment of communication sessions |
UA93118C2 (ru) * | 2006-11-14 | 2011-01-10 | Квелкомм Инкорпорейтед | Системы и способы для переключения каналов |
JP2010510725A (ja) * | 2006-11-15 | 2010-04-02 | クゥアルコム・インコーポレイテッド | チャネル切り替えフレームを用いたアプリケーションのシステム及び方法 |
CN100499815C (zh) * | 2007-01-12 | 2009-06-10 | 清华大学 | 一种支持视频帧随机读取的视频编解码方法 |
KR100834443B1 (ko) * | 2007-02-27 | 2008-06-04 | 삼성전자주식회사 | 비디오 코덱을 위한 메모리 구조 및 메모리 액세스 방법 |
WO2008129500A2 (en) * | 2007-04-24 | 2008-10-30 | Nokia Corporation | System and method for implementing fast tune-in with intra-coded redundant pictures |
CN101321284B (zh) | 2007-06-10 | 2012-01-04 | 华为技术有限公司 | 一种编解码方法、设备及系统 |
US9237101B2 (en) | 2007-09-12 | 2016-01-12 | Digital Fountain, Inc. | Generating and communicating source identification information to enable reliable communications |
JP2010103969A (ja) * | 2008-09-25 | 2010-05-06 | Renesas Technology Corp | 画像復号方法、画像復号装置、画像符号化方法及び画像符号化装置 |
US9432723B2 (en) | 2009-08-03 | 2016-08-30 | Google Technology Holdings LLC | Method of encoding video content |
EP2475173B1 (en) * | 2009-09-03 | 2016-10-12 | Nec Corporation | Video encoding device, video encoding method and video encoding program |
US9917874B2 (en) | 2009-09-22 | 2018-03-13 | Qualcomm Incorporated | Enhanced block-request streaming using block partitioning or request controls for improved client-side handling |
US9036692B2 (en) * | 2010-01-18 | 2015-05-19 | Mediatek Inc. | Motion prediction method |
JP2011199396A (ja) * | 2010-03-17 | 2011-10-06 | Ntt Docomo Inc | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム |
KR101682147B1 (ko) | 2010-04-05 | 2016-12-05 | 삼성전자주식회사 | 변환 및 역변환에 기초한 보간 방법 및 장치 |
MX2012012246A (es) * | 2010-04-22 | 2012-12-17 | Mediatek Inc | Metodo de prediccion de movimiento. |
US9049497B2 (en) | 2010-06-29 | 2015-06-02 | Qualcomm Incorporated | Signaling random access points for streaming video data |
US9185439B2 (en) | 2010-07-15 | 2015-11-10 | Qualcomm Incorporated | Signaling data for multiplexing video components |
US9596447B2 (en) | 2010-07-21 | 2017-03-14 | Qualcomm Incorporated | Providing frame packing type information for video coding |
US8806050B2 (en) | 2010-08-10 | 2014-08-12 | Qualcomm Incorporated | Manifest file updates for network streaming of coded multimedia data |
US9516379B2 (en) * | 2011-03-08 | 2016-12-06 | Qualcomm Incorporated | Buffer management in video codecs |
US9706227B2 (en) * | 2011-03-10 | 2017-07-11 | Qualcomm Incorporated | Video coding techniques for coding dependent pictures after random access |
US8964056B2 (en) | 2011-06-30 | 2015-02-24 | Cisco Technology, Inc. | Encoder-supervised imaging for video cameras |
MX337077B (es) | 2011-07-02 | 2016-02-11 | Samsung Electronics Co Ltd | Metodo y aparato para multiplexar y desmultiplexar datos de video para identificar el estado de reproduccion de los datos de video. |
US9253233B2 (en) | 2011-08-31 | 2016-02-02 | Qualcomm Incorporated | Switch signaling methods providing improved switching between representations for adaptive HTTP streaming |
US20130089152A1 (en) * | 2011-10-05 | 2013-04-11 | Qualcomm Incorporated | Signaling picture identification for video coding |
US9906815B2 (en) * | 2011-11-08 | 2018-02-27 | Texas Instruments Incorporated | Delayed duplicate I-picture for video coding |
US9930360B2 (en) * | 2011-11-08 | 2018-03-27 | Texas Instruments Incorporated | Method, system and apparatus for intra-refresh in video signal processing |
US9538200B2 (en) * | 2012-01-19 | 2017-01-03 | Qualcomm Incorporated | Signaling of deblocking filter parameters in video coding |
US9351016B2 (en) | 2012-04-13 | 2016-05-24 | Sharp Kabushiki Kaisha | Devices for identifying a leading picture |
US20130272619A1 (en) * | 2012-04-13 | 2013-10-17 | Sharp Laboratories Of America, Inc. | Devices for identifying a leading picture |
US9532055B2 (en) | 2012-04-16 | 2016-12-27 | Microsoft Technology Licensing, Llc | Constraints and unit types to simplify video random access |
KR102241998B1 (ko) | 2012-04-23 | 2021-04-19 | 엘지전자 주식회사 | 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 |
US9736476B2 (en) * | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
US9516308B2 (en) | 2012-04-27 | 2016-12-06 | Qualcomm Incorporated | Parameter set updates in video coding |
WO2014003379A1 (ko) * | 2012-06-24 | 2014-01-03 | 엘지전자 주식회사 | 영상 디코딩 방법 및 이를 이용하는 장치 |
US9591303B2 (en) * | 2012-06-28 | 2017-03-07 | Qualcomm Incorporated | Random access and signaling of long-term reference pictures in video coding |
AU2015213423B2 (en) * | 2012-06-28 | 2016-12-01 | Ntt Docomo, Inc. | Dynamic image predictive encoding and decoding device, method, and program |
US9225978B2 (en) | 2012-06-28 | 2015-12-29 | Qualcomm Incorporated | Streaming adaption based on clean random access (CRA) pictures |
JP6045222B2 (ja) * | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
JP5891975B2 (ja) * | 2012-07-02 | 2016-03-23 | 富士通株式会社 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
WO2014042460A1 (ko) | 2012-09-13 | 2014-03-20 | 엘지전자 주식회사 | 영상 부호화/복호화 방법 및 장치 |
US9491457B2 (en) * | 2012-09-28 | 2016-11-08 | Qualcomm Incorporated | Signaling of regions of interest and gradual decoding refresh in video coding |
CN104838649A (zh) * | 2012-09-28 | 2015-08-12 | 三星电子株式会社 | 针对随机访问的用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备 |
US9749627B2 (en) * | 2013-04-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Control data for motion-constrained tile set |
JP6261215B2 (ja) * | 2013-07-12 | 2018-01-17 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
JP6344392B2 (ja) * | 2013-08-22 | 2018-06-20 | ソニー株式会社 | 符号化装置、符号化方法、送信装置、復号化装置、復号化方法および受信装置 |
US10264272B2 (en) | 2013-10-15 | 2019-04-16 | Qualcomm Incorporated | Device and method for scalable coding of video information |
JP6398569B2 (ja) * | 2014-10-07 | 2018-10-03 | 株式会社ソシオネクスト | 画像符号化装置、画像符号化方法および画像符号化プログラム |
EP3198867A4 (en) * | 2014-10-31 | 2018-04-04 | MediaTek Inc. | Method of improved directional intra prediction for video coding |
US9762912B2 (en) | 2015-01-16 | 2017-09-12 | Microsoft Technology Licensing, Llc | Gradual updating using transform coefficients for encoding and decoding |
US20170094292A1 (en) * | 2015-09-28 | 2017-03-30 | Samsung Electronics Co., Ltd. | Method and device for parallel coding of slice segments |
CN112956206B (zh) | 2018-08-29 | 2024-07-30 | 夏普株式会社 | 发送逐渐刷新的方法 |
SG11202106524PA (en) * | 2018-12-20 | 2021-07-29 | Ericsson Telefon Ab L M | Normative indication of recovery point |
EP3928511A4 (en) * | 2019-03-11 | 2022-06-22 | Huawei Technologies Co., Ltd. | STEP-BY-STEP DECODE REFRESH IN VIDEO ENCODING |
EP3928522A4 (en) | 2019-03-12 | 2022-04-06 | Huawei Technologies Co., Ltd. | DISTRIBUTED DECODING REFRESH DESIGN IN VIDEO CODING |
US11706429B2 (en) | 2019-03-12 | 2023-07-18 | Hyundai Motor Company | Method and device for encoding and decoding image involving gradual refresh technique |
JP6967653B2 (ja) * | 2019-12-19 | 2021-11-17 | 株式会社Nttドコモ | 動画像予測復号方法 |
US11792432B2 (en) * | 2020-02-24 | 2023-10-17 | Tencent America LLC | Techniques for signaling and identifying access unit boundaries |
US20240179304A1 (en) * | 2022-11-29 | 2024-05-30 | Tencent America LLC | Systems and methods for signaling of downsampling filters for chroma from luma intra prediction mode |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05137131A (ja) * | 1991-11-13 | 1993-06-01 | Sony Corp | フレーム間動き予測方法 |
JP3358835B2 (ja) * | 1992-12-14 | 2002-12-24 | ソニー株式会社 | 画像符号化方法及び装置 |
US5726711A (en) * | 1993-01-13 | 1998-03-10 | Hitachi America, Ltd. | Intra-coded video frame data processing methods and apparatus |
US5778143A (en) * | 1993-01-13 | 1998-07-07 | Hitachi America, Ltd. | Method and apparatus for the selection of data for use in VTR trick playback operation in a system using progressive picture refresh |
EP0670663A1 (fr) * | 1994-03-02 | 1995-09-06 | Laboratoires D'electronique Philips S.A.S. | Procédé et dispositif de codage de signaux numériques représentatifs d'une séquence d'images |
US5635982A (en) | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
EP0731614B1 (en) * | 1995-03-10 | 2002-02-06 | Kabushiki Kaisha Toshiba | Video coding/decoding apparatus |
US5650823A (en) * | 1995-03-27 | 1997-07-22 | International Business Machines Corporation | Half pel motion estimation method for B pictures |
JP3297293B2 (ja) * | 1996-03-07 | 2002-07-02 | 三菱電機株式会社 | 動画像復号方法および動画像復号装置 |
JP3698805B2 (ja) * | 1996-03-25 | 2005-09-21 | パイオニア株式会社 | 情報記録装置及び方法、情報処理装置及び方法並びに情報再生装置及び方法 |
CA2208950A1 (en) * | 1996-07-03 | 1998-01-03 | Xuemin Chen | Rate control for stereoscopic digital video encoding |
US6310609B1 (en) | 1997-04-17 | 2001-10-30 | Nokia Mobile Phones Limited | User interface with guide lights |
US6499060B1 (en) * | 1999-03-12 | 2002-12-24 | Microsoft Corporation | Media coding for loss recovery with remotely predicted data units |
JP3694888B2 (ja) * | 1999-12-03 | 2005-09-14 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体 |
GB2366464A (en) * | 2000-08-14 | 2002-03-06 | Nokia Mobile Phones Ltd | Video coding using intra and inter coding on the same data |
FI120125B (fi) * | 2000-08-21 | 2009-06-30 | Nokia Corp | Kuvankoodaus |
AU2002239237A1 (en) * | 2000-10-10 | 2002-06-03 | Broadcom Corporation | System and method for special reproduction modes of a digitally encoded video data stream |
US6980596B2 (en) * | 2001-11-27 | 2005-12-27 | General Instrument Corporation | Macroblock level adaptive frame/field coding for digital video content |
US20030169816A1 (en) * | 2002-01-22 | 2003-09-11 | Limin Wang | Adaptive universal variable length codeword coding for digital video content |
US7149247B2 (en) * | 2002-01-22 | 2006-12-12 | Microsoft Corporation | Methods and systems for encoding and decoding video data to enable random access and splicing |
JP4355156B2 (ja) * | 2002-04-16 | 2009-10-28 | パナソニック株式会社 | 画像復号化方法及び画像復号化装置 |
US7848428B2 (en) * | 2004-06-17 | 2010-12-07 | Broadcom Corporation | System and method for reducing visible artifacts in video coding using multiple reference pictures |
-
2003
- 2003-07-16 MX MXPA05000558A patent/MXPA05000558A/es active IP Right Grant
- 2003-07-16 EP EP17151577.8A patent/EP3177020B1/en not_active Expired - Lifetime
- 2003-07-16 CA CA2492751A patent/CA2492751C/en not_active Expired - Lifetime
- 2003-07-16 AU AU2003251964A patent/AU2003251964A1/en not_active Abandoned
- 2003-07-16 EP EP03764749.2A patent/EP1547382A4/en not_active Withdrawn
- 2003-07-16 BR BRPI0312657-9A patent/BR0312657A/pt not_active Application Discontinuation
- 2003-07-16 JP JP2004521916A patent/JP2005533444A/ja active Pending
- 2003-07-16 WO PCT/US2003/022262 patent/WO2004008735A2/en active Application Filing
- 2003-07-16 CN CNA038167271A patent/CN1669321A/zh active Pending
- 2003-07-16 US US10/620,730 patent/US8300690B2/en active Active
- 2003-07-16 CN CNA2008100031856A patent/CN101232615A/zh active Pending
- 2003-07-16 CN CN200810003744.3A patent/CN101232616B/zh not_active Expired - Lifetime
- 2003-07-16 KR KR1020057000656A patent/KR100754419B1/ko active IP Right Grant
-
2007
- 2007-11-29 JP JP2007308707A patent/JP4695129B2/ja not_active Expired - Lifetime
-
2009
- 2009-01-22 HK HK09100708.4A patent/HK1123653A1/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO2004008735A2 (en) | 2004-01-22 |
JP4695129B2 (ja) | 2011-06-08 |
US20040066854A1 (en) | 2004-04-08 |
EP3177020B1 (en) | 2023-04-19 |
EP1547382A4 (en) | 2013-10-30 |
KR100754419B1 (ko) | 2007-08-31 |
CN101232616A (zh) | 2008-07-30 |
WO2004008735A3 (en) | 2004-03-18 |
US8300690B2 (en) | 2012-10-30 |
CA2492751C (en) | 2012-06-12 |
CA2492751A1 (en) | 2004-01-22 |
CN1669321A (zh) | 2005-09-14 |
KR20050019864A (ko) | 2005-03-03 |
CN101232615A (zh) | 2008-07-30 |
HK1123653A1 (zh) | 2009-06-19 |
EP3177020A1 (en) | 2017-06-07 |
AU2003251964A8 (en) | 2004-02-02 |
JP2008099325A (ja) | 2008-04-24 |
JP2005533444A (ja) | 2005-11-04 |
BR0312657A (pt) | 2007-06-26 |
EP1547382A2 (en) | 2005-06-29 |
CN101232616B (zh) | 2015-07-22 |
AU2003251964A1 (en) | 2004-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4695129B2 (ja) | 画像符号化におけるランダム・アクセス及び段階的画像更新に対する方法 | |
US7324595B2 (en) | Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction | |
JP7364685B2 (ja) | エンコーダ、デコーダおよび対応する方法 | |
CA2977526C (en) | Modification of unification of intra block copy and inter signaling related syntax and semantics | |
US8885730B2 (en) | Image coding method, image decoding method, and apparatuses therefor | |
CN114827600B (zh) | 一种图像解码的方法及解码器 | |
US20120230423A1 (en) | Line memory reduction for video coding and decoding | |
US20140056356A1 (en) | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes | |
US7020200B2 (en) | System and method for direct motion vector prediction in bi-predictive video frames and fields | |
EP1466477A2 (en) | Coding dynamic filters | |
US20060104357A1 (en) | Video coding | |
GB2501125A (en) | Providing adaptation parameters to a decoder by including an identifier to a relevant characteristic set in a bit stream portion. | |
CN117956190A (zh) | 视频译码中的显式地址指示 | |
US20210409698A1 (en) | Design for distributed decoding refresh in video coding | |
CN115086671A (zh) | 资源受约束的视频编码 | |
TWI789632B (zh) | 用於參考圖像重新取樣擴展之編碼器與解碼器、編碼方法及解碼方法 | |
JP2024504672A (ja) | 復号プロセスのエネルギー消費を表す情報をシグナリングするためのメタデータ | |
US6754270B1 (en) | Encoding high-definition video using overlapping panels | |
RU2810200C2 (ru) | Способ и устройство кодирования изображения на основе подкартинки | |
RU2810653C2 (ru) | Способ и устройство кодирования изображения для управления контурной фильтрацией | |
RU2802374C1 (ru) | Устройство и способ кодирования изображения для управления контурной фильтрацией | |
US20220078461A1 (en) | Encoder and decoder, encoding method and decoding method for drift-free padding and hashing of independent coding regions | |
CN119452644A (zh) | 使用自适应跨分量滤波的色度运动补偿的方法和设备 | |
WO2014031734A1 (en) | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |