[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2774909T5 - Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes - Google Patents

Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes Download PDF

Info

Publication number
ES2774909T5
ES2774909T5 ES16181274T ES16181274T ES2774909T5 ES 2774909 T5 ES2774909 T5 ES 2774909T5 ES 16181274 T ES16181274 T ES 16181274T ES 16181274 T ES16181274 T ES 16181274T ES 2774909 T5 ES2774909 T5 ES 2774909T5
Authority
ES
Spain
Prior art keywords
duplicate
section
matrix
quantization matrix
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16181274T
Other languages
English (en)
Other versions
ES2774909T3 (es
Inventor
Kazushi Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=46206911&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2774909(T5) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of ES2774909T3 publication Critical patent/ES2774909T3/es
Application granted granted Critical
Publication of ES2774909T5 publication Critical patent/ES2774909T5/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

DESCRIPCIÓN
Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
Campo técnico
La presente divulgación se refiere a un dispositivo de procesamiento de imágenes y a un método de procesamiento de imágenes.
Antecedentes de la técnica
H.264/AVC, una de las especificaciones de normas para esquemas de codificación de imágenes, puede usar diferentes escalones de cuantificación para componentes de coeficientes de transformación ortogonal para cuantificar datos de imagen en un perfil igual a un Perfil Alto o superior. Se puede configurar un escalón de cuantificación para cada componente de coeficiente de transformación ortogonal basándose en una matriz de cuantificación (también denominada lista de ajuste a escala) y un valor escalón de referencia. La matriz de cuantificación se define como de un tamaño sustancialmente igual al de una unidad de transformación ortogonal.
La figura 19 ilustra unos valores preestablecidos (valores por defecto) para cuatro tipos de matrices de cuantificación predefinidas en la norma H.264/AVC. Por ejemplo, la matriz SL01 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 4 * 4 en modo de intra predicción. La matriz SL02 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 4 * 4 en modo de inter predicción. La matriz SL03 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 8 * 8 en modo de intra predicción. La matriz SL04 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 8 * 8 en modo de inter predicción. Un usuario puede usar un conjunto de parámetros de secuencia o un conjunto de parámetros de imagen para especificar una matriz de cuantificación específica diferente de los valores por defecto mostrados en la figura 19. Si no se usa la matriz de cuantificación, se usa un valor igual para todos los componentes del escalón de cuantificación usado para la cuantificación.
La Codificación de Vídeo de Alta Eficiencia (HEVC) es un esquema de codificación de imágenes de próxima generación como sucesor de la norma H.264/AVC y se promueve su normalización. HEVC incorpora el concepto de unidad de codificación (CU) que corresponde a un macro bloque convencional (véase la Bibliografía no de patente 1 a continuación). El conjunto de parámetros de secuencia especifica un rango de tamaños de unidades de codificación usando un conjunto de valores de potencia de dos que son una unidad de codificación más grande (LCU) y una unidad de codificación más pequeña (SCU). El uso de split_flag especifica un tamaño de unidad de codificación específico dentro del rango especificado por LCU y SCU.
De acuerdo con HEVC, una unidad de codificación se puede dividir en una o más unidades de transformación ortogonal, en concreto, una o más unidades de transformación (TU). El tamaño de la unidad de transformación se puede establecer a cualquiera de entre 4 * 4, 8 * 8, 16 * 16 y 32 * 32. En consecuencia, se puede especificar una matriz de cuantificación de acuerdo con cada uno de estos candidatos de tamaño de unidad de transformación.
H.264/AVC permite designar solo una matriz de cuantificación para un tamaño de unidad de transformación dentro de una imagen, como se especifica en el software de referencia publicado (http://iphome.hhi.de/suehring/tml/index.htm) denominado modelo conjunto (JM). Por el contrario, la Bibliografía no de patente 2 mostrada a continuación propone designar múltiples candidatas de matriz de cuantificación para un tamaño de unidad de transformación dentro de una imagen y seleccionar de forma adaptativa una matriz de cuantificación para cada bloque desde el punto de vista de la optimización de la distorsión de tasa (RD).
Lista de citas
El documento WO 2004/0077810 A2 divulga un método de codificación de imágenes y un método de descodificación de imágenes de una forma bloque a bloque. El documento US 2008/0192824 divulga un método de codificación de vídeo y un aparato de codificación de vídeo que buscan reducir los artefactos pulsantes.
Bibliografía no de patente
Bibliografía no de patente 1: JCTVC-B205, " Test Model under Consideration", Equipo de Colaboración Mixto sobre Codificación de Vídeo (JCT-VC) de la UIT-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11, 2a Reunión: Ginebra, CH, 21-28 de julio de 2010
Bibliografía no de patente 2: VCEG-AD06, " Adaptive Quantization Matrix Selection on KTA Software", UIT - Sector de Normalización de las Telecomunicaciones, Grupo de Estudio 16, Pregunta 6, Grupo de Expertos en Codificación de Vídeo (VCEG), 30a Reunión: Hangzhou, China, 23-24 de octubre de 2006
Sumario de la invención
Problema técnico
Sin embargo, el aumento de los tipos de tamaño de unidad de transformación seleccionables también aumenta el número de matrices de cuantificación disponibles. El aumento de la cantidad de códigos de matrices de cuantificación puede deteriorar la eficiencia de codificación. La eficiencia de codificación se puede deteriorar más notablemente si el número de matrices de cuantificación que se pueden designar para cada tamaño de unidad de transformación cambia de uno a más.
La tecnología de acuerdo con la presente divulgación tiene por objeto proporcionar un dispositivo de procesamiento de imágenes y un método de procesamiento de imágenes capaces de moderar un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
Solución al problema
La invención se expone en las reivindicaciones adjuntas.
Efectos ventajosos de la invención
Como se ha descrito anteriormente, el dispositivo de procesamiento de imágenes y el método de procesamiento de imágenes de acuerdo con la presente divulgación pueden moderar un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
Breve descripción de los dibujos
[Fig. 1] La figura 1 es un diagrama de bloques que ilustra una configuración de hardware de un dispositivo de codificación de imágenes de acuerdo con una realización.
[Fig. 2] La figura 2 es un diagrama de bloques que ilustra una configuración detallada de una sección de transformación ortogonal y de cuantificación de acuerdo con una realización.
[Fig. 3] La figura 3 es un diagrama de bloques que ilustra una configuración más detallada de una sección de procesamiento de matrices de acuerdo con una realización.
[Fig. 4] La figura 4 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de secuencia de acuerdo con una realización.
[Fig. 5] La figura 5 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de imagen de acuerdo con una realización.
[Fig. 6A] La figura 6A es la primera mitad de un diagrama de flujo que ilustra un primer ejemplo de un flujo de proceso de codificación de acuerdo con una realización.
[Fig. 6B] La figura 6B es la última mitad de un diagrama de flujo que ilustra el primer ejemplo de un flujo de proceso de codificación de acuerdo con una realización.
[Fig. 7A] La figura 7A es la primera mitad de un diagrama de flujo que ilustra un segundo ejemplo de un flujo de proceso de codificación de acuerdo con una realización.
[Fig. 7B] La figura 7B es la última mitad de un diagrama de flujo que ilustra el segundo ejemplo de un flujo de proceso de codificación de acuerdo con una realización.
[Fig. 8] La figura 8 es un diagrama de bloques que ilustra una configuración de un dispositivo de descodificación de imágenes de acuerdo con una realización.
[Fig. 9] La figura 9 es un diagrama de bloques que ilustra una configuración detallada de una sección de cuantificación inversa y de transformación ortogonal inversa de acuerdo con una realización.
[Fig. 10] La figura 10 es un diagrama de bloques que ilustra una configuración más detallada de una sección de generación de matrices de acuerdo con una realización.
[Fig. 11A] La figura 11A es la primera mitad de un diagrama de flujo que ilustra un primer ejemplo de un flujo de proceso de descodificación de acuerdo con una realización.
[Fig. 11B] La figura 11B es la última mitad de un diagrama de flujo que ilustra el primer ejemplo de un flujo de proceso de descodificación de acuerdo con una realización.
[Fig. 12A] La figura 12A es la primera mitad de un diagrama de flujo que ilustra un segundo ejemplo de un flujo de proceso de descodificación de acuerdo con una realización.
[Fig. 12B] La figura 12B es la última mitad de un diagrama de flujo que ilustra el segundo ejemplo de un flujo de proceso de descodificación de acuerdo con una realización.
[Fig. 13A] La figura 13A es la primera mitad de un diagrama de flujo que ilustra un ejemplo de un flujo de proceso de codificación de acuerdo con una modificación.
[Fig. 13B] La figura 13B es la última mitad de un diagrama de flujo que ilustra el ejemplo de un flujo de proceso de codificación de acuerdo con una modificación.
[Fig. 14A] La figura 14A es la primera mitad de un diagrama de flujo que ilustra un ejemplo de un flujo de proceso de descodificación de acuerdo con una modificación.
[Fig. 14B] La figura 14B es la primera mitad de un diagrama de flujo que ilustra el ejemplo de un flujo de proceso de descodificación de acuerdo con una modificación.
[Fig. 15] La figura 15 es un diagrama de bloques que ilustra una configuración esquemática de un aparato de televisión.
[Fig. 16] La figura 16 es un diagrama de bloques que ilustra una configuración esquemática de un teléfono móvil.
[Fig. 17] La figura 17 es un diagrama de bloques que ilustra una configuración esquemática de un dispositivo de registro/reproducción.
[Fig. 18] La figura 18 es un diagrama de bloques que ilustra una configuración esquemática de un dispositivo de captura de imágenes.
[Fig. 19] La figura 19 es un diagrama explicativo que ilustra valores por defecto de matriz de cuantificación predefinidos en H.264/AVC.
Descripción de realización
En lo sucesivo en el presente documento, se describirán con detalle realizaciones preferidas de la presente invención con referencia a los dibujos adjuntos. Obsérvese que, en esta memoria descriptiva y en los dibujos, elementos que tienen sustancialmente la misma función y estructura se indican con los mismos signos de referencia, y se omite una explicación repetida.
Asimismo, la descripción detallada de la(s) realización(es) se describe en un orden siguiente.
1. Ejemplos de configuración del dispositivo de codificación de imágenes de acuerdo con una realización 1-1. Ejemplo de configuración global
1-2. Ejemplo de configuración de la sección de transformación ortogonal y de cuantificación
1-3. Ejemplo de configuración detallado de la sección de procesamiento de matrices
1-4. Ejemplos de información a codificar
2. Flujo de proceso de codificación de acuerdo con una realización
3. Ejemplos de configuración del dispositivo de descodificación de imágenes de acuerdo con una realización 3-1. Ejemplo de configuración global
3-2. Ejemplo de configuración de la sección de cuantificación inversa y de transformación ortogonal inversa 3-3. Ejemplo de configuración detallado de la sección de generación de matrices
4. Flujo de proceso de descodificación de acuerdo con una realización
5. Modificaciones
6. Aplicaciones de ejemplo
7. En resumen
<1. Ejemplos de configuración del dispositivo de codificación de imágenes de acuerdo con una realización
A continuación se describen ejemplos de configuración del dispositivo de codificación de imágenes de acuerdo con una realización.
[1-1. Dispositivo de codificación de imágenes]
La figura 1 es un diagrama de bloques que muestra un ejemplo de una configuración de un dispositivo de codificación de imágenes 10 de acuerdo con una realización. Haciendo referencia a la figura 1, el dispositivo de codificación de imágenes 10 incluye una sección de conversión A/D (de Analógico a Digital) 11, una memoria intermedia de reordenación 12, una sección de sustracción 13, una sección de transformación ortogonal y de cuantificación 14, una sección de codificación sin pérdidas 16, una memoria intermedia de acumulación 17, una sección de control de tasa 18, una sección de cuantificación inversa 21, una sección de transformación ortogonal inversa 22, una sección de adición 23, un filtro de desbloqueo 24, una memoria de tramas 25, un selector 26, una sección de intra predicción 30, una sección de estimación de movimiento 40 y una sección de selección de modo 50.
La sección de conversión A/D 11 convierte una entrada de señal de imagen en un formato analógico en datos de imagen en un formato digital y emite una serie de datos de imagen digitales a la memoria intermedia de reordenación 12.
La memoria intermedia de reordenación 12 clasifica las imágenes incluidas en la serie de datos de imagen introducidos desde la sección de conversión A/D 11. Después de reordenar las imágenes de acuerdo con la estructura de GOP (Grupo de Imágenes) de acuerdo con el proceso de codificación, la memoria intermedia de reordenación 12 emite los datos de imagen que se han clasificado a la sección de sustracción 13, la sección de intra predicción 30 y la sección de estimación de movimiento 40.
Los datos de imagen introducidos desde la memoria intermedia de reordenación 12 y los datos de imagen predichos seleccionados por la sección de selección de modo 50 descrita más adelante se suministran a la sección de sustracción 13. La sección de sustracción 13 calcula datos de error predichos, que son una diferencia entre los datos de imagen introducidos desde la memoria intermedia de reordenación 12 y los datos de imagen predichos introducidos desde la sección de selección de modo 50, y emite los datos de error predichos calculados a la sección de transformación ortogonal y de cuantificación 14.
La sección de transformación ortogonal y de cuantificación 14 realiza una transformación ortogonal y una cuantificación de los datos de error de predicción suministrados desde la sección de sustracción 13 y emite datos de coeficientes de transformación cuantificados (denominados, en lo sucesivo en el presente documento, datos cuantificados) a una sección de codificación sin pérdidas 16 y a una sección de cuantificación inversa 21. Una tasa de bits de datos cuantificados emitidos desde la sección de transformación ortogonal y de cuantificación 14 se controla basándose en una señal de control de tasa desde una sección de control de tasa 18. Más adelante se describirá una configuración detallada de la sección de transformación ortogonal y de cuantificación 14.
A la sección de codificación sin pérdidas 16, se le suministran datos cuantificados introducidos desde la sección de transformación ortogonal y de cuantificación 14, información para generar una matriz de cuantificación en el lado de descodificación, e información acerca de intra predicción o inter predicción seleccionada por una sección de selección de modo 50. La información acerca de la intra predicción puede contener información de modo de predicción que indica un modo de intra predicción apropiado para cada bloque. La información acerca de inter predicción puede contener información de modo de predicción para la predicción de un vector de movimiento para cada bloque, un vector de movimiento de diferencias e información de imagen de referencia, por ejemplo.
La sección de codificación sin pérdidas 16 realiza una codificación sin pérdidas sobre datos cuantificados para generar un flujo codificado. La sección de codificación sin pérdidas 16 puede proporcionar una codificación de longitud variable o una codificación aritmética como una codificación sin pérdidas. La sección de codificación sin pérdidas 16 multiplexa información para generar una matriz de cuantificación (que se describirá más adelante) en un encabezamiento (por ejemplo, un conjunto de parámetros de secuencia y un conjunto de parámetros de imagen) de un flujo codificado. Además, la sección de codificación sin pérdidas 16 multiplexa información acerca de la intra predicción o la inter predicción en el encabezamiento de flujo codificado. La sección de codificación sin pérdidas 16 emite un flujo codificado generado a la memoria intermedia de almacenamiento 17.
La memoria intermedia de acumulación 17 almacena temporalmente el flujo codificado introducido desde la sección de codificación sin pérdidas 16 usando un medio de almacenamiento, tal como una memoria de semiconductores. Entonces, la memoria intermedia de acumulación 17 emite el flujo codificado acumulado a una tasa de acuerdo con la banda de una línea de transmisión (o una línea de salida desde el dispositivo de codificación de imágenes 10).
La sección de control de tasa 18 supervisa el espacio libre de la memoria intermedia de acumulación 17. Entonces, la sección de control de tasa 18 genera una señal de control de tasa de acuerdo con el espacio libre en la memoria intermedia de acumulación 17, y emite la señal de control de tasa generada a la sección de transformación ortogonal y de cuantificación 14. Por ejemplo, cuando no hay mucho espacio libre en la memoria intermedia de acumulación 17, la sección de control de tasa 18 genera una señal de control de tasa para bajar la tasa de bits de los datos cuantificados. Asimismo, por ejemplo, cuando el espacio libre en la memoria intermedia de acumulación 17 es suficientemente grande, la sección de control de tasa 18 genera una señal de control de tasa para aumentar la tasa de bits de los datos cuantificados.
La sección de cuantificación inversa 21 realiza un proceso de cuantificación inversa sobre los datos cuantificados introducidos desde la sección de transformación ortogonal y de cuantificación 14. Entonces, la sección de cuantificación inversa 21 emite datos de coeficientes de transformación adquiridos por el proceso de cuantificación inversa a la sección de transformación ortogonal inversa 22.
La sección de transformación ortogonal inversa 22 realiza un proceso de transformación ortogonal inversa sobre los datos de coeficientes de transformación introducidos desde la sección de cuantificación inversa 21 para restablecer de ese modo los datos de error predichos. Entonces, la sección de transformación ortogonal inversa 22 emite los datos de error predichos restablecidos a la sección de adición 23.
La sección de adición 23 añade los datos de error predichos restablecidos introducidos desde la sección de transformación ortogonal inversa 22 y los datos de imagen predichos introducidos desde la sección de selección de modo 50 para generar de ese modo datos de imagen descodificados. Entonces, la sección de adición 23 emite los datos de imagen descodificados generados al filtro de desbloqueo 24 y a la memoria de tramas 25.
Un filtro de desbloqueo 24 realiza un proceso de filtrado para disminuir la distorsión de bloque que tiene lugar durante la codificación de imágenes. El filtro de desbloqueo 24 elimina la distorsión de bloque filtrando los datos de imagen descodificados introducidos desde la sección de adición 23 y, entonces, después del filtrado, emite los datos de imagen descodificados a la memoria de tramas 25.
La memoria de tramas 25 almacena, usando un medio de almacenamiento, los datos de imagen descodificados introducidos desde la sección de adición 23 y los datos de imagen descodificados después del filtrado introducidos desde el filtro de desbloqueo 24.
El selector 26 lee, de la memoria de tramas 25, los datos de imagen descodificados antes del filtrado que se van a usar para la intra predicción, y suministra los datos de imagen descodificados que se han leído a la sección de intra predicción 30 como datos de imagen de referencia. Asimismo, el selector 26 lee, de la memoria de tramas 25, los datos de imagen descodificados después del filtrado que se van a usar para la inter predicción, y suministra los datos de imagen descodificados que se han leído a la sección de estimación de movimiento 40 como datos de imagen de referencia.
La sección de intra predicción 30 realiza un proceso de intra predicción en cada modo de intra predicción, basándose en los datos de imagen a codificar que se introducen desde la memoria intermedia de reordenación 12 y los datos de imagen descodificados suministrados a través del selector 26. Por ejemplo, la sección de intra predicción 30 evalúa el resultado de la predicción de cada modo de intra predicción usando una función de coste predeterminada. Entonces, la sección de intra predicción 30 selecciona un modo de intra predicción mediante el cual el valor de función de coste es el más pequeño, es decir, un modo de intra predicción mediante el cual la relación de compresión es la más alta, como el modo de intra predicción óptimo. Además, la sección de intra predicción 30 emite, a la sección de selección de modo 50, información de modo de predicción que indica el modo de intra predicción óptimo, los datos de imagen predichos y la información acerca de intra predicción tal como el valor de función de coste.
Una sección de estimación de movimiento 40 realiza un proceso de inter predicción (proceso de predicción entre tramas) basándose en datos de imagen para su codificación suministrados desde una memoria intermedia de reordenación 12 y datos de imagen descodificados suministrados a través de un selector 26. Por ejemplo, la sección de estimación de movimiento 40 evalúa el resultado de la predicción de cada modo de predicción usando una función de coste predeterminada. Entonces, la sección de estimación de movimiento 40 selecciona un modo de predicción óptimo, en concreto, un modo de predicción que minimiza el valor de función de coste o maximiza la relación de compresión. La sección de estimación de movimiento 40 genera datos de imagen predichos de acuerdo con el modo de predicción óptimo. La sección de estimación de movimiento 40 emite información acerca de la inter predicción, tal como información relacionada con la inter predicción, que incluye información de modo de predicción que indica el modo de intra predicción óptimo, los datos de imagen predichos y el valor de función de coste a una sección de selección de modo 50.
La sección de selección de modo 50 compara el valor de función de coste relacionado con la intra predicción introducido desde la sección de intra predicción 30 y el valor de función de coste relacionado con la inter predicción introducido desde la sección de estimación de movimiento 40. Entonces, la sección de selección de modo 50 selecciona un método de predicción con un valor de función de coste más pequeño, de entre la intra predicción y la inter predicción. En el caso de seleccionar la intra predicción, la sección de selección de modo 50 emite la información acerca de intra predicción a la sección de codificación sin pérdidas 16, y también emite los datos de imagen predichos a la sección de sustracción 13 y a la sección de adición 23. Asimismo, en el caso de seleccionar la inter predicción, la sección de selección de modo 50 emite la información acerca de inter predicción descrita anteriormente a la sección de codificación sin pérdidas 16, y también emite los datos de imagen predichos a la sección de sustracción 13 y a la sección de adición 23.
[1-2. Ejemplo de configuración de la sección de transformación ortogonal y de cuantificación]
La figura 2 es un diagrama de bloques que ilustra una configuración detallada de la sección de transformación ortogonal y de cuantificación 14 del dispositivo de codificación de imágenes 10 ilustrado en la figura 1. Con referencia a la figura 2, la sección de transformación ortogonal y de cuantificación 14 incluye una sección de selección 110, una sección de transformación ortogonal 120, una sección de cuantificación 130, una memoria intermedia de matrices de cuantificación 140 y una sección de procesamiento de matrices 15.
(1) Sección de selección
La sección de selección 110 selecciona una unidad de transformación (TU) usada para la transformación ortogonal de datos de imagen a codificar a partir de múltiples unidades de transformación que tienen diferentes tamaños. Los candidatos de tamaño de las unidades de transformación a seleccionar por la sección de selección 110 incluyen 4 * 4 y 8 * 8 para H.264/AVC y 4 * 4, 8 * 8, 16 * 16 y 32 * 32 para HEVC. La sección de selección 110 puede seleccionar cualquiera de las unidades de transformación de acuerdo con el tamaño de una imagen a codificar, la calidad de imagen o el desempeño del aparato, por ejemplo. Un usuario que desarrolla aparatos puede ajustar manualmente la selección de unidades de transformación por la sección de selección 110. La sección de selección 110 emite información que especifica el tamaño de la unidad de transformación seleccionada a la sección de transformación ortogonal 120, la sección de cuantificación 130, la sección de codificación sin pérdidas 16 y la sección de cuantificación inversa 21.
(2) Sección de transformación ortogonal
La sección de transformación ortogonal 120 transforma ortogonalmente datos de imagen (es decir, datos de error de predicción) suministrados desde la sección de sustracción 13 usando la unidad de transformación seleccionada por la sección de selección 110. La transformación ortogonal realizada por la sección de transformación ortogonal 120 puede representar, por ejemplo, una transformada de coseno discreta (DCT) o una transformada de Karhunen-Loeve. La sección de transformación ortogonal 120 emite datos de coeficientes de transformación adquiridos por un proceso de transformación ortogonal a la sección de cuantificación 130.
(3) Sección de cuantificación
La sección de cuantificación 130 cuantifica datos de coeficientes de transformación generados por la sección de transformación ortogonal 120 usando una matriz de cuantificación que corresponde a la unidad de transformación seleccionada por la sección de selección 110. La sección de cuantificación 130 varía una tasa de bits de datos cuantificados de salida cambiando escalones de cuantificación basándose en una señal de control de tasa desde la sección de control de tasa 18.
La sección de cuantificación 130 permite que la memoria intermedia de matrices de cuantificación 140 almacene conjuntos de matrices de cuantificación que corresponden a unidades de transformación seleccionadas por la sección de selección 110. Por ejemplo, HEVC proporciona candidatos de unidad de transformación de cuatro tipos de tamaño tales como 4 * 4, 8 * 8, 16 * 16 y 32 * 32. En un caso como este, la memoria intermedia de matrices de cuantificación 140 puede almacenar cuatro tipos de conjuntos de matrices de cuantificación que corresponden a los cuatro tipos de tamaño. Se puede dar el caso de que un tamaño específico use una matriz de cuantificación por defecto, como se muestra en la figura 19. En un caso como este, la memoria intermedia de matrices de cuantificación 140 puede almacenar solo un indicador que indica el uso de la matriz de cuantificación por defecto (sin usar una matriz de cuantificación definida por el usuario) en asociación con el tamaño específico.
Un conjunto de matrices de cuantificación que puede usar la sección de cuantificación 130 se puede configurar habitualmente para cada secuencia de flujos codificados. Si se configura un conjunto de matrices de cuantificación para cada secuencia, la sección de cuantificación 130 puede actualizar el conjunto para cada imagen. Se puede insertar información para controlar la configuración y la actualización de conjuntos de matrices de cuantificación en un conjunto de parámetros de secuencia y en un conjunto de parámetros de imagen, por ejemplo.
(4) Memoria intermedia de matrices de cuantificación
La memoria intermedia de matrices de cuantificación 140 usa un medio de almacenamiento tal como una memoria de semiconductores para almacenar temporalmente conjuntos de matrices de cuantificación que corresponden a unidades de transformación seleccionadas por la sección de selección 110. Un proceso realizado por la sección de procesamiento de matrices 150 que se describirá a continuación hace referencia a un conjunto de matrices de cuantificación almacenadas por la memoria intermedia de matrices de cuantificación 140.
(5) Sección de procesamiento de matrices
La sección de procesamiento de matrices 150 hace referencia a un conjunto de matrices de cuantificación almacenadas en la memoria intermedia de matrices de cuantificación 140 para cada secuencia de flujos codificados y cada imagen y genera información que genera una matriz de cuantificación que corresponde a una unidad de transformación de uno o más tamaños a partir de otra matriz de cuantificación que corresponde a una unidad de transformación de un tamaño. Una matriz de cuantificación se puede generar habitualmente basándose en el mínimo de los tamaños de unidad de transformación. Si HEVC proporciona candidatos de unidad de transformación de cuatro tipos de tamaño tales como 4 * 4, 8 * 8, 16 * 16 y 32 * 32, se puede usar una matriz de cuantificación de 4 * 4 para generar la información que genera matrices de cuantificación de los otros tamaños. La información generada por la sección de procesamiento de matrices 15 puede incluir información de matriz básica e información de matriz de diferencias que se describirán más adelante. La información generada por la sección de procesamiento de matrices 150 se emite a la sección de codificación sin pérdidas 16 y se puede insertar en el encabezamiento de flujo codificado.
La memoria descriptiva describe principalmente un ejemplo de generación de una matriz de cuantificación de un tamaño más grande a partir de una matriz de cuantificación del tamaño mínimo. Aunque no se limita a esto, se puede generar una matriz de cuantificación que tiene un tamaño más pequeño y/o un tamaño más grande a partir de una matriz de cuantificación que tiene un tamaño que no sea el tamaño mínimo.
[1-3. Ejemplo de configuración detallado de la sección de procesamiento de matrices]
La figura 3 es un diagrama de bloques que ilustra una configuración más detallada de la sección de procesamiento de matrices 150 de la sección de transformación ortogonal y de cuantificación 14 ilustrada en la figura 2. Con referencia a la figura 3, la sección de procesamiento de matrices 150 incluye una sección de predicción 152 y una sección de cálculo de diferencias 154.
(1) Sección de predicción
La sección de predicción 152 adquiere un conjunto de matrices de cuantificación almacenadas en la memoria intermedia de matrices de cuantificación 140 y predice una segunda matriz de cuantificación que tiene un tamaño más grande a partir de una primera matriz de cuantificación contenida en el conjunto adquirido. Por ejemplo, una matriz de cuantificación de 4 * 4 SL1 se define como sigue.
[Operación matemática 1]
Figure imgf000008_0001
Por ejemplo, una matriz predicha de 8 x 8 PSL2 puede ser predicha por la sección de predicción 152 a partir de la matriz de cuantificación SL1 y calcularse como sigue de acuerdo con la expresión de predicción (2) a continuación.
[Operación matemática 2]
Figure imgf000008_0002
Con referencia a la expresión de predicción (2), duplicar uno de dos elementos adyacentes entre sí en la matriz de cuantificación SL1 genera la matriz predicha PSL2 como un elemento entre los dos elementos.
En lugar de ello, la matriz predicha PSL2 se puede calcular a partir de la matriz de cuantificación SL1 de acuerdo con la expresión de predicción (3) a continuación.
[Operación matemática 3]
Figure imgf000008_0003
( 3 )
Con referencia a la expresión de predicción (3), interpolar linealmente uno de dos elementos adyacentes entre sí en la matriz de cuantificación SL1 genera la matriz predicha PSL2 como un elemento entre los dos elementos. La expresión de predicción (3) duplica el elemento de extremo derecho en la matriz predicha PSL2 a partir del elemento adyacente a la izquierda. En lugar de la duplicación, se puede usar la extrapolación lineal para calcular los elementos de extremo derecho. De modo similar, se puede usar la extrapolación lineal para calcular el elemento inferior en la matriz predicha PSL2 de acuerdo con la expresión de predicción (3), en lugar de duplicar el elemento adyacente justo encima. Por ejemplo, la expresión de predicción (3) produce a33 para el elemento PSL2 8,8 en la octava fila y la octava columna en la matriz predicha PSL2. El mismo elemento también se puede calcular como sigue de acuerdo con la extrapolación lineal.
[Operación matemática 4]
m 2 M - °” ~ B a l aB ( 4)
La expresión de predicción (2) puede generar la matriz predicha PSL2 con unos costes de cálculo menores que los de la expresión de predicción (3). El uso de la expresión de predicción (3) puede generar una matriz predicha suave más aproximada a una matriz de cuantificación a usar originalmente. Por lo tanto, el uso de la expresión de predicción (3) puede reducir la cantidad de información codificada al hacer que los elementos de una matriz de diferencias que se describirá más adelante sean aproximadamente iguales a cero.
Las expresiones de predicción y (2) y (3) son meros ejemplos de expresiones de predicción disponibles. Se puede usar cualquiera otra expresión de predicción.
Después de generar la matriz predicha PSL2 a partir de la matriz de cuantificación SL1, la sección de predicción 152 emite la matriz predicha PSL2 generada a la sección de cálculo de diferencias 154. Por ejemplo, la sección de predicción 152 predice una matriz predicha de 16 x 16 PSL3 a partir de la matriz predicha de 8 x 8 SL2 contenida en el conjunto de matrices de cuantificación y emite la matriz predicha PSL3 a la sección de cálculo de diferencias 154. Además, la sección de predicción 152 predice una matriz predicha de 32 x 32 PSL4 a partir de la matriz de cuantificación de 16 x 16 SL3 contenida en el conjunto de matrices de cuantificación y emite la matriz predicha PSL4 a la sección de cálculo de diferencias 154. Se puede usar una expresión de predicción que es igual a la expresión de predicción (2) o (3) descrita anteriormente para predecir las matrices predichas PSL3 y PSL4. La sección de predicción 152 emite la información de matriz básica a la sección de codificación sin pérdidas 16. La información de matriz básica especifica la matriz de cuantificación de 4 x 4 SL1 como una base para la generación de las matrices predichas PSL2, PSL3 y PSL4 descritas anteriormente.
(2) Sección de cálculo de diferencias
La sección de cálculo de diferencias 154 calcula unas matrices de diferencias DSL2, DSL3 y DSL4 de acuerdo con las expresiones (5) a (7). Cada una de las matrices de diferencias DSL2, DSL3 y DSL4 representa una diferencia entre cada una de las matrices predichas PSL2, PSL3 y PSL4 suministradas desde la sección de predicción 152 y cada una de las matrices de cuantificación SL2, SL3 y SL4 correspondientes.
[Operación matemática 5]
DSL2 = SL2 - PSL2 (5)
DSL3 = SL3 - PSL3 (6)
DSL4 = SL4 - PSL4 (7)
La sección de cálculo de diferencias 154 suministra información que representa las matrices de diferencias DSL2, DSL3 y DSL4 a la sección de codificación sin pérdidas 16.
Si se usa una matriz de cuantificación por defecto para un tamaño dado, la sección de procesamiento de matrices 150 no realiza una predicción y un cálculo de diferencias sobre una matriz de cuantificación de ese tamaño. En cambio, la sección de procesamiento de matrices 150 suministra a la sección de codificación sin pérdidas 16 solo un indicador que indica el uso de la matriz de cuantificación por defecto en asociación con el tamaño correspondiente. Si no hay diferencias entre la matriz predicha y la matriz de cuantificación, la sección de cálculo de diferencias 154 no emite información de matriz de diferencias, sino que emite solo un indicador que indica que no hay diferencias a la sección de codificación sin pérdidas 16. Si la matriz de cuantificación no se actualiza con la temporización del cambio de una imagen, la sección de procesamiento de matrices 150 puede suministrar solo un indicador que indica que no se actualiza la matriz de cuantificación a la sección de codificación sin pérdidas 16.
[1-4. Ejemplos de información a codificar]
(1) Conjunto de parámetros de secuencia
La figura 4 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de secuencia de acuerdo con la realización. La figura 4 muestra tres tipos de información tales como un "indicador de tipo de matriz", un "indicador de diferencia" e "información de matriz (a codificar) " como información a codificar para cada tamaño de matriz de cuantificación o tamaño de la unidad de transformación (TU).
El indicador de tipo de matriz especifica si usar una matriz de cuantificación definida por el usuario o una matriz de cuantificación por defecto para cada tamaño. Si el indicador de tipo de matriz se establece a 1 para un tamaño dado, se usa una matriz de cuantificación definida por el usuario para el tamaño. Si el indicador de tipo de matriz se establece a 0 para un tamaño dado, se usa una matriz de cuantificación por defecto para el tamaño. Si el indicador de tipo de matriz se establece a 0, no se codifica ninguna de la información de matriz, la información de matriz de diferencias y el indicador de diferencia descritos a continuación.
El indicador de diferencia identifica si hay una diferencia entre la matriz predicha y la matriz de cuantificación si el indicador de tipo de matriz se establece a 1 para cada tamaño para indicar la matriz de cuantificación definida por el usuario. Si el indicador de tipo de matriz se establece a 1 para un tamaño dado, existe una diferencia entre la matriz predicha y la matriz de cuantificación para el tamaño y se codifica la información de matriz de diferencias. Si el indicador de tipo de matriz se establece a 0 para un tamaño dado, no se codifica la información de matriz de diferencias para el tamaño. El indicador de diferencia no se codifica para el tamaño (por ejemplo, 4 * 4) como una base de predicción independientemente del indicador de tipo de matriz.
(2) Conjunto de parámetros de imagen
La figura 5 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de imagen de acuerdo con la realización. La figura 5 muestra cuatro tipos de información, tales como un "indicador de actualización", un "indicador de tipo de matriz", un "indicador de diferencia" e "información de matriz (a codificar)" como información a codificar para cada tamaño de matriz de cuantificación o de unidad de transformación (TU). El indicador de tipo de matriz y el indicador de diferencia tienen los mismos significados que los indicadores con los mismos nombres para los conjuntos de parámetros de secuencia que se han descrito con referencia a la figura 4.
El indicador de actualización indica si actualizar la matriz de cuantificación con la temporización del cambio de una imagen para cada tamaño. Si el indicador de actualización se establece a 1 para un tamaño dado, se actualiza una matriz de cuantificación del tamaño. Si el indicador de actualización se establece a 0, no se actualiza una matriz de cuantificación del tamaño y una matriz de cuantificación especificada para la imagen previa o la secuencia actual se usa tal cual. Si el indicador de actualización se establece a 0, no se codifica ninguno de entre el indicador de tipo de matriz, el indicador de diferencia y la información de matriz de diferencias (o la información de matriz para 4 * 4) para el tamaño.
<2. Flujo de proceso de codificación de acuerdo con una realización
Las figuras 6A y 6B son diagramas de flujo que ilustran un primer ejemplo de un flujo de proceso de codificación de acuerdo con la realización. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.
Con referencia a la figura 6A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en esta secuencia (la etapa S100). Como ejemplo, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 * 4, de 8 * 8, de 16 * 16 y de 32 * 32.
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 * 4 es una definida por el usuario (la etapa S102). Si la matriz de cuantificación de 4 * 4 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 4 * 4 con el indicador de tipo de matriz establecido a 1 (la etapa S106). Si la matriz de cuantificación de 4 * 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S108).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 * 8 es una definida por el usuario (la etapa S112). Si la matriz de cuantificación de 8 * 8 es una definida por el usuario, la sección de procesamiento de matrices 150 usa la expresión de predicción (2) o (3) descrita anteriormente para calcular una matriz predicha de 8 * 8 a partir de la matriz de cuantificación de 4 * 4 (la etapa S114). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 * 8 y la matriz predicha calculada (la etapa S116). Si la matriz de cuantificación de 8 * 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S118).
Con referencia a la figura 6B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 * 16 es una definida por el usuario (la etapa S122). Si la matriz de cuantificación de 16 * 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 16 * 16 a partir de la matriz de cuantificación de 8 * 8 (la etapa S124). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 * 16 y la matriz predicha calculada (la etapa S126). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S128).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S132). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 32 x 32 a partir de la matriz de cuantificación de 16 x 16 (la etapa S134). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 32 x 32 y la matriz predicha calculada (la etapa S136). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S138).
Las figuras 7A y 7B son diagramas de flujo que ilustran un segundo ejemplo de un flujo de proceso de codificación de acuerdo con la realización. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada imagen que corresponde a una secuencia de flujos codificados.
Con referencia a la figura 7A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en la imagen (la etapa S150). De forma similar a la de los ejemplos en las figuras 6A y 6B, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 x 4, de 8 x 8, de 16 x 16 y de 32 x 32.
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 x 4 se actualiza en la imagen (la etapa S152). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S158). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S154. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una nueva matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S154). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 4 x 4 con el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 1 (la etapa S156). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S158).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 se actualiza en la imagen (la etapa S160). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S168). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S162. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S162). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 8 x 8 a partir de la matriz de cuantificación de 4 x 4 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 4 x 4 (la etapa S164). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 x 8 y la matriz predicha calculada (la etapa S166). Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S168).
Con referencia a la figura 7B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 se actualiza en la imagen (la etapa S170). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S178). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S172. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S172). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 16 x 16 a partir de la matriz de cuantificación de 8 x 8 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 8 x 8 (la etapa S174). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 x 16 y la matriz predicha calculada (la etapa S176). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S178).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 se actualiza en la imagen (la etapa S180). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S188). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S182. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S182). Si la matriz de cuantificación de 32 * 32 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 32 * 32 a partir de la matriz de cuantificación de 16 * 16 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 16 * 16 (la etapa S184). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 32 * 32 y la matriz predicha calculada (la etapa S186). Si la matriz de cuantificación de 32 * 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S188).
La técnica para predecir matrices de cuantificación basándose en una matriz de cuantificación puede eliminar la necesidad de transmitir múltiples matrices de cuantificación que corresponden a múltiples tamaños de unidades de transformación desde el lado de codificación al lado de descodificación. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.
<3. Ejemplos de configuración del dispositivo de descodificación de imágenes de acuerdo con una realización
A continuación se describen ejemplos de configuración del dispositivo de descodificación de imágenes de acuerdo con una realización.
[3-1. Ejemplo de configuración global]
La figura 8 es un diagrama de bloques que muestra un ejemplo de una configuración de un dispositivo de descodificación de imágenes 60 de acuerdo con una realización. Con referencia a la figura 8, el dispositivo de descodificación de imágenes 60 incluye una memoria intermedia de acumulación 61, una sección de descodificación sin pérdidas 62, una sección de cuantificación inversa y de transformación ortogonal inversa 63, una sección de adición 65, un filtro de desbloqueo 66, una memoria intermedia de reordenación 67, una sección de conversión D/A (de Digital a Analógico) 68, una memoria de tramas 69, unos selectores 70 y 71, una sección de intra predicción 80 y una sección de compensación de movimiento 90.
La memoria intermedia de acumulación 61 almacena temporalmente un flujo codificado introducido a través de una línea de transmisión usando un medio de almacenamiento.
La sección de descodificación sin pérdidas 62 descodifica un flujo codificado suministrado desde la memoria intermedia de almacenamiento 61 de acuerdo con el sistema de codificación usado para la codificación. La sección de descodificación sin pérdidas 62 descodifica información multiplexada en el área de encabezamiento de flujos codificados. La información multiplexada en el área de encabezamiento de flujos codificados puede incluir la información de matriz básica y la información de matriz de diferencias para generar la matriz de cuantificación descrita anteriormente e información acerca de intra predicción e inter predicción en el encabezamiento de bloque. La sección de descodificación sin pérdidas 62 suministra información para generar datos cuantificados y una matriz de cuantificación después de la descodificación a la sección de cuantificación inversa y de transformación ortogonal inversa 63. La sección de descodificación sin pérdidas 62 suministra información acerca de la intra predicción a la sección de intra predicción 80. La sección de descodificación sin pérdidas 62 suministra información acerca de la inter predicción a la sección de compensación de movimiento 90.
La sección de cuantificación inversa y de transformación ortogonal inversa 63 realiza una cuantificación inversa y una transformación ortogonal inversa sobre datos cuantificados suministrados desde la sección de descodificación sin pérdidas 62 para generar datos de error de predicción. La sección de cuantificación inversa y de transformación ortogonal inversa 63 suministra los datos de error de predicción generados a la sección de adición 65.
La sección de adición 65 añade los datos de error predichos introducidos desde la sección de cuantificación inversa y de transformación ortogonal inversa 63 y los datos de imagen predichos introducidos desde el selector 71 para generar de ese modo datos de imagen descodificados. Entonces, la sección de adición 65 emite los datos de imagen descodificados generados al filtro de desbloqueo 66 y a la memoria de tramas 69.
El filtro de desbloqueo 66 elimina la distorsión de bloque filtrando los datos de imagen descodificados introducidos desde la sección de adición 65 y, entonces, después del filtrado, emite los datos de imagen descodificados a la memoria intermedia de reordenación 67 y a la memoria de tramas 69.
La memoria intermedia de reordenación 67 genera una serie de datos de imagen en una secuencia de tiempo reordenando imágenes introducidas desde el filtro de desbloqueo 66. Entonces, la memoria intermedia de reordenación 67 emite los datos de imagen generados a la sección de conversión D/A 68.
La sección de conversión D/A 68 convierte los datos de imagen en un formato digital introducidos desde la memoria intermedia de reordenación 67 en una señal de imagen en un formato analógico. Entonces, la sección de conversión D/A 68 hace que se visualice una imagen emitiendo la señal de imagen analógica a un visualizador (no mostrado) conectado al dispositivo de descodificación de imágenes 60, por ejemplo.
La memoria de tramas 69 usa un medio de almacenamiento para almacenar los datos de imagen descodificados introducidos desde la sección de adición 65 antes del filtrado y los datos de imagen descodificados introducidos desde el filtro de desbloqueo 66 después del filtrado.
El selector 70 conmuta el destino de salida de los datos de imagen desde la memoria de tramas 69 entre la sección de intra predicción 80 y la sección de compensación de movimiento 90 para cada bloque en la imagen de acuerdo con información de modo adquirida por la sección de descodificación sin pérdidas 62. Por ejemplo, en el caso de que se especifique el modo de intra predicción, el selector 70 emite los datos de imagen descodificados antes del filtrado que se suministran desde la memoria de tramas 69 a la sección de intra predicción 80 como datos de imagen de referencia. Asimismo, en el caso de que se especifique el modo de inter predicción, el selector 70 emite los datos de imagen descodificados después del filtrado que se suministran desde la memoria de tramas 69 a la sección de compensación de movimiento 90 como los datos de imagen de referencia.
El selector 71 conmuta el origen de salida de los datos de imagen predichos a suministrar a la sección de adición 65 entre la sección de intra predicción 80 y la sección de compensación de movimiento 90 para cada bloque en la imagen de acuerdo con la información de modo adquirida por la sección de descodificación sin pérdidas 62. Por ejemplo, en el caso de que se especifique el modo de intra predicción, el selector 71 suministra a la sección de adición 65 los datos de imagen predichos emitidos desde la sección de intra predicción 80. En el caso de que se especifique el modo de inter predicción, el selector 71 suministra a la sección de adición 65 los datos de imagen predichos emitidos desde la sección de compensación de movimiento 90.
La sección de intra predicción 80 realiza una predicción en pantalla de un valor de píxel basándose en la información acerca de intra predicción introducida desde la sección de descodificación sin pérdidas 62 y los datos de imagen de referencia introducidos desde la memoria de tramas 69, y genera datos de imagen predichos. Entonces, la sección de intra predicción 80 emite los datos de imagen predichos generados al selector 71.
La sección de compensación de movimiento 90 realiza un proceso de compensación de movimiento basándose en la información acerca de inter predicción introducida desde la sección de descodificación sin pérdidas 62 y los datos de imagen de referencia introducidos desde la memoria de tramas 69, y genera datos de imagen predichos. Entonces, la sección de compensación de movimiento 90 emite los datos de imagen predichos generados al selector 71.
[3-2. Ejemplo de configuración de la sección de cuantificación inversa y de transformación ortogonal inversa]
La figura 9 es un diagrama de bloques que ilustra una configuración detallada de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 ilustrado en la figura 8. Como se muestra en la figura 9, la sección de cuantificación inversa y de transformación ortogonal inversa 63 incluye una sección de generación de matrices 210, una sección de selección 230, una sección de cuantificación inversa 240 y una sección de transformación ortogonal inversa 250.
(1) Sección de generación de matrices
La sección de generación de matrices 210 genera una matriz de cuantificación que corresponde a unidades de transformación que representan uno o más tamaños a partir de una matriz de cuantificación que corresponde a una unidad de transformación que representa un tamaño para cada imagen y secuencia de flujos codificados. Una matriz de cuantificación se puede generar habitualmente basándose en el mínimo de los tamaños de unidad de transformación. De acuerdo con la realización, la sección de generación de matrices 210 genera matrices de cuantificación de 8 * 8, de 16 * 16 y de 32 * 32 a partir de una matriz de cuantificación de 4 * 4 como el tamaño mínimo usando la información de matriz de diferencias acerca de tamaños más grandes.
(2) Sección de selección
La sección de selección 230 selecciona una unidad de transformación (TU) usada para la transformación ortogonal inversa de datos de imagen a descodificar a partir de múltiples unidades de transformación que tienen diferentes tamaños. Los candidatos de tamaño de las unidades de transformación a seleccionar por la sección de selección 230 incluyen 4 * 4 y 8 * 8 para H.264/AVC y 4 * 4, 8 * 8, 16 * 16 y 32 * 32 para HEVC. La sección de selección 230 puede seleccionar una unidad de transformación basándose en LCU, SCU y split_flag contenidos en el encabezamiento de flujo codificado, por ejemplo. La sección de selección 230 emite información que especifica el tamaño de la unidad de transformación seleccionada a la sección de cuantificación inversa 240 y a la sección de transformación ortogonal inversa 250.
(3) Sección de cuantificación inversa
La sección de cuantificación inversa 240 usa una matriz de cuantificación que corresponde a la unidad de transformación seleccionada por la sección de selección 230 para cuantificar inversamente datos de coeficientes de transformación cuantificados durante la codificación de imágenes. Las matrices de cuantificación usadas para la cuantificación inversa contienen una matriz generada por la sección de generación de matrices 210. Por ejemplo, la sección de selección 230 puede seleccionar una unidad de transformación de 8 * 8, de 16 * 16 o de 32 * 32. En un caso como este, la unidad de transformación seleccionada puede corresponder a la matriz de cuantificación que la sección de generación de matrices 210 genera a partir de una matriz de cuantificación de 4 * 4. La sección de cuantificación inversa 240 suministra los datos de coeficientes de transformación cuantificados inversamente a la sección de transformación ortogonal inversa 250.
(4) Sección de transformación ortogonal inversa
La sección de transformación ortogonal inversa 250 genera datos de error de predicción de acuerdo con el sistema de transformación ortogonal usado para la codificación. Para hacer esto, la sección de transformación ortogonal inversa 250 usa la unidad de transformación seleccionada para realizar la transformación ortogonal inversa sobre datos de coeficientes de transformación cuantificados inversamente por la sección de cuantificación inversa 240. La sección de transformación ortogonal inversa 250 suministra los datos de error de predicción generados a la sección de adición 65.
[3-3. Ejemplo de configuración detallado de la sección de generación de matrices]
La figura 10 es un diagrama de bloques que ilustra una configuración más detallada de la sección de generación de matrices 210 de la sección de cuantificación inversa y de transformación ortogonal inversa 63 ilustrada en la figura 9. Con referencia a la figura 10, la sección de generación de matrices 210 incluye una sección de adquisición de matrices de base 212, una sección de adquisición de diferencias 214, una sección de predicción 216, una sección de reconstrucción 218 y una memoria intermedia de matrices de cuantificación 220.
(1) Sección de adquisición de matrices de base
La sección de adquisición de matrices de base 212 adquiere información de matriz básica suministrada desde la sección de descodificación sin pérdidas 62. Como se ha descrito anteriormente, la información de matriz básica de acuerdo con la realización especifica una matriz de cuantificación de 4 * 4 SL1 como el tamaño mínimo. La sección de adquisición de matrices de base 212 permite que la memoria intermedia de matrices de cuantificación 220 almacene una matriz de cuantificación de 4 * 4 SL1 especificada en la información de matriz básica. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen, la sección de adquisición de matrices de base 212 permite que la memoria intermedia de matrices de cuantificación 220 almacene la matriz de cuantificación de 4 * 4 por defecto sin adquirir la información de matriz básica. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de matrices de base 212 no actualiza la matriz de cuantificación SL1 almacenada en la memoria intermedia de matrices de cuantificación 220 durante el proceso previo. La sección de adquisición de matrices de base 212 suministra la matriz de cuantificación de 4 * 4 SL1 a la sección de predicción 216.
(2) Sección de adquisición de diferencias
La sección de adquisición de diferencias 214 adquiere la información de matriz de diferencias suministrada desde la sección de descodificación sin pérdidas 62. Como se ha descrito anteriormente, la información de matriz de diferencias de acuerdo con la realización especifica unas matrices de diferencias DSL2, DSL3, y DSL4, cada una de las cuales representa una diferencia entre cada una de las matrices predichas PSL2, PSL3 y PSL4 predichas a partir de la matriz de cuantificación de 4 * 4 SL1 y cada una de las matrices de cuantificación SL2, SL3 y SL4, respectivamente. La sección de adquisición de diferencias 214 suministra las matrices de diferencias DSL2, DSL3 y DSL4 especificadas en la información de matriz de diferencias a la sección de reconstrucción 218. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen o se adquiere el indicador de diferencia establecido a 0, la sección de adquisición de diferencias 214 asume que una matriz de diferencias que tiene el tamaño correspondiente es nula sin adquirir la información de matriz de diferencias. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de diferencias 214 no emite matriz de diferencias alguna para el tamaño correspondiente.
(3) Sección de predicción
La sección de predicción 216 sigue la expresión de predicción usada para la codificación de imágenes, tal como la expresión de predicción (2) o (3) descrita anteriormente para calcular la matriz predicha de 8 * 8 PSL2 que tiene un tamaño más grande a partir de la matriz de base, tal como la matriz de cuantificación de 4 * 4 SL1 de acuerdo con la realización suministrada desde la sección de adquisición de matrices de base 212. La sección de predicción 216 usa la matriz predicha de 8 * 8 PSL2 calculada para calcular la matriz predicha de 16 * 16 PSL3 a partir de la matriz de cuantificación SL2 reconstruida por la sección de reconstrucción 218. Además, la sección de predicción 216 usa la matriz predicha de 16 * 16 PSL3 calculada para calcular la matriz predicha de 32 * 32 PSL4 a partir de la matriz de cuantificación SL3 reconstruida por la sección de reconstrucción 218. La sección de predicción 216 suministra las matrices predichas PSL2, PSL3 y PSL4 a la sección de reconstrucción 218. La sección de predicción 216 no genera matriz predicha alguna para un tamaño que tiene el indicador de tipo de matriz establecido a 0 y usa la matriz de cuantificación por defecto para calcular matrices predichas que tienen unos tamaños más grandes. La sección de adquisición de matrices de base 212 no genera matriz predicha alguna para un tamaño que tiene el indicador de actualización establecido a 0 y usa la matriz de cuantificación generada en el proceso previo para calcular matrices predichas que tienen unos tamaños más grandes.
(4) Sección de reconstrucción
La sección de reconstrucción 218 reconstruye las matrices de cuantificación SL2, SL3 y SL4 añadiendo las matrices predichas PSL2, PSL3 y PSL4 suministradas desde la sección de predicción 216 a las matrices de diferencias DSL2, DSL3 y DSL4 suministradas desde la sección de adquisición de diferencias 214, respectivamente.
[Operación matemática 6]
SL2 = PSL2 - PDSL2 (8)
SL3 = PSL3 - DSL3 (9)
SL4 = PSL4 - DSL4 (10)
La sección de reconstrucción 218 permite que la memoria intermedia de matrices de cuantificación 220 almacene las matrices de cuantificación reconstruidas SL2, SL3 y SL4 que tienen unos tamaños de 8 * 8, de 16 * 16 y de 32 * 32. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen, la sección de reconstrucción 218 permite que la memoria intermedia de matrices de cuantificación 220 almacene la matriz de cuantificación por defecto como una matriz de cuantificación que tiene el tamaño correspondiente. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de matrices de base 212 no actualiza la matriz de cuantificación SL2, SL3 o SL4 que tiene el tamaño correspondiente y se almacena en la memoria intermedia de matrices de cuantificación 220 durante el proceso previo.
(5) Memoria intermedia de matrices de cuantificación
La memoria intermedia de matrices de cuantificación 220 almacena temporalmente la matriz de cuantificación SL1 especificada por la sección de adquisición de matrices de base 212 y las matrices de cuantificación SL2, SL3 y SL4 reconstruidas por la sección de reconstrucción 218. Las matrices de cuantificación SL1, SL2, SL3 y SL4 almacenadas en la memoria intermedia de matrices de cuantificación 220 se usan para que la sección de cuantificación inversa 240 cuantifique inversamente los datos de coeficientes de transformación cuantificados.
La configuración de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 descrito anteriormente también es aplicable a la sección de cuantificación inversa 21 y a la sección de transformación ortogonal inversa 22 del dispositivo de descodificación de imágenes 10 mostrado en la figura 1.
<4. Flujo de proceso de descodificación de acuerdo con una realización
Las figuras 11A y 11B son diagramas de flujo que ilustran un primer ejemplo de un flujo de proceso de descodificación de acuerdo con la realización. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.
Con referencia a la figura 11A, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz contenido en el conjunto de parámetros de secuencia de la secuencia para determinar si la matriz de cuantificación de 4 * 4 es una definida por el usuario (la etapa S202). Si la matriz de cuantificación de 4 * 4 es una definida por el usuario, la sección de generación de matrices 210 usa la información de matriz básica para establecer la matriz de cuantificación de 4 * 4, en concreto, almacenar la misma en la memoria intermedia de matrices de cuantificación 220 (la etapa S204). Si la matriz de cuantificación de 4 * 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 * 4 por defecto (la etapa S206).
La sección de generación de matrices 210 determina si una matriz de cuantificación de 8 * 8 es una definida por el usuario (la etapa S212). Si la matriz de cuantificación de 8 * 8 es una definida por el usuario, la sección de generación de matrices 210 usa la expresión de predicción (2) o (3) descrita anteriormente para calcular una matriz predicha de 8 * 8 a partir de la matriz de cuantificación de 4 * 4 y añade la matriz predicha calculada a una matriz de diferencias de 8 * 8. Como resultado, se reconstruye la matriz de cuantificación de 8 * 8 (la etapa S214). Si el indicador de diferencia de 8 * 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 * 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 * 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 * 8 por defecto (la etapa S216).
Con referencia a la figura 11B, la sección de generación de matrices 210 determina si una matriz de cuantificación de 16 * 16 es una definida por el usuario (la etapa S222). Si la matriz de cuantificación de 16 * 16 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 16 * 16 a partir de la matriz de cuantificación de 8 * 8 y añade la matriz predicha calculada a una matriz de diferencias de 16 * 16. Como resultado, se reconstruye la matriz de cuantificación de 16 * 16 (la etapa S224). Si el indicador de diferencia de 16 * 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 * 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 * 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 * 16 por defecto (la etapa S226).
La sección de generación de matrices 210 determina si una matriz de cuantificación de 32 * 32 es una definida por el usuario (la etapa S232). Si la matriz de cuantificación de 32 * 32 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 32 * 32 a partir de la matriz de cuantificación de 16 * 16 y añade la matriz predicha calculada a una matriz de diferencias de 32 * 32. Como resultado, se reconstruye la matriz de cuantificación de 32 * 32 (la etapa S234). Si el indicador de diferencia de 32 * 32 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 32 * 32 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 32 * 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 * 32 por defecto (la etapa S236).
Las figuras 12A y 12B son diagramas de flujo que ilustran un segundo ejemplo de un flujo de proceso de descodificación de acuerdo con la realización. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada imagen para un flujo codificado.
Con referencia a la figura 12A, la sección de generación de matrices 210 comprueba el indicador de actualización contenido en un conjunto de parámetros de imagen para determinar si una matriz de cuantificación de 4 * 4 se actualiza en la imagen (la etapa S250). Si no se actualiza una matriz de cuantificación de 4 * 4, el proceso omite las etapas S252 a S256. Si se actualiza una matriz de cuantificación de 4 * 4, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 4 * 4 es una definida por el usuario (la etapa S252). Si la matriz de cuantificación de 4 * 4 es una definida por el usuario, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 * 4 usando la información de matriz básica (la etapa S254). Si la matriz de cuantificación de 4 * 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 * 4 por defecto (la etapa S256).
La sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 8 * 8 se actualiza en la imagen (la etapa S260). Si no se actualiza una matriz de cuantificación de 8 * 8, el proceso omite las etapas S262 a S266. Si se actualiza una matriz de cuantificación de 8 * 8, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 8 * 8 es una definida por el usuario (la etapa S262). Si la matriz de cuantificación de 8 * 8 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 8 * 8 a partir de la matriz de cuantificación de 4 * 4 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 4 * 4. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 8 * 8. Como resultado, se reconstruye la matriz de cuantificación de 8 * 8 (la etapa S264). Si el indicador de diferencia de 8 * 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 * 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 * 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 * 8 por defecto (la etapa S266).
Con referencia a la figura 12B, la sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 16 * 16 se actualiza en la imagen (la etapa S270). Si no se actualiza una matriz de cuantificación de 16 * 16, el proceso omite las etapas S272 a S276. Si se actualiza una matriz de cuantificación de 16 * 16, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 16 * 16 es una definida por el usuario (la etapa S272). Si la matriz de cuantificación de 16 * 16 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 16 * 16 a partir de la matriz de cuantificación de 8 * 8 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 8 * 8. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 16 * 16. Como resultado, se reconstruye la matriz de cuantificación de 16 * 16 (la etapa S274). Si el indicador de diferencia de 16 * 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 * 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 * 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 * 16 por defecto (la etapa S276).
La sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 32 * 32 se actualiza en la imagen (la etapa S280). Si no se actualiza una matriz de cuantificación de 32 * 32, el proceso omite las etapas S282 a S286. Si se actualiza una matriz de cuantificación de 32 * 32, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 32 * 32 es una definida por el usuario (la etapa S282). Si la matriz de cuantificación de 32 * 32 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 32 * 32 a partir de la matriz de cuantificación de 16 * 16 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 16 * 16. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 32 * 32. Como resultado, se reconstruye la matriz de cuantificación de 32 * 32 (la etapa S284). Si el indicador de diferencia de 32 x 32 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 32 x 32 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 x 32 por defecto (la etapa S286).
El lado de descodificación puede reconstruir de forma adecuada matrices de cuantificación usando la técnica para predecir matrices de cuantificación basándose en una matriz de cuantificación, incluso si el lado de codificación transmite, al lado de descodificación, solo la información de diferencias acerca de una matriz de cuantificación a predecir. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.
La memoria descriptiva ha descrito el ejemplo de establecer solo un tipo de matriz de cuantificación para un tamaño de unidad de transformación. Aunque no se limita a esto, se pueden establecer múltiples tipos de matrices de cuantificación para un tamaño de unidad de transformación. En un caso como este, el conjunto de parámetros de secuencia y el conjunto de parámetros de imagen pueden contener un indicador adicional que indica cuál de múltiples tipos de matrices de cuantificación es necesario usar como una base para predecir una matriz de cuantificación de un tamaño más grande. Puede ser preferible establecer múltiples tipos de matrices de cuantificación para un tamaño de unidad de transformación y de forma selectiva una matriz de cuantificación a otra para cada sector o bloque dentro de una imagen.
<5. Modificaciones>
Como se ha descrito anteriormente, la tecnología divulgada en esta memoria descriptiva se puede realizar prediciendo una matriz de cuantificación de un tamaño más pequeño a partir de una matriz de cuantificación de un tamaño más grande. Por ejemplo, una matriz de cuantificación de 8 x 8 SL2 se define como sigue.
[Operación matemática 7]
Figure imgf000017_0001
Por ejemplo, la sección de predicción 152 de la sección de transformación ortogonal y de cuantificación 14 del dispositivo de codificación de imágenes 10 calcula la matriz predicha de 4 x 4 PSL1 a partir de la matriz de cuantificación SL2 de acuerdo con la expresión de predicción (12) como sigue.
[Operación matemática 8]
Figure imgf000017_0002
Con referencia a la expresión de predicción (12), la matriz predicha PSL1 se genera adelgazando elementos de la matriz de cuantificación SL2 en filas y columnas alternas. Los elementos a adelgazar se pueden situar de una forma que no sea la del ejemplo de la expresión de predicción (12). El aumento del número de elementos a adelgazar puede hacer que una matriz de cuantificación genere una matriz predicha que tiene unos lados en los que cada lado es un cuarto o más pequeño.
En lugar de ello, la matriz predicha PSL1 se puede calcular a partir de la matriz de cuantificación SL2 de acuerdo con la expresión de predicción (13) a continuación.
[Operación matemática 9]
Figure imgf000018_0001
Con referencia a la expresión de predicción (13), la matriz predicha PSL1 se genera calculando un promedio de cuatro elementos adyacentes vertical y horizontalmente entre sí en la matriz de cuantificación SL2 como un elemento de la matriz predicha PSL1. Promediar más elementos (por ejemplo, 16 elementos) adyacentes vertical y horizontalmente entre sí puede hacer que una matriz de cuantificación genere una matriz predicha que tiene unos lados en los que cada lado es un cuarto o más pequeño. En lugar del promedio usado en la expresión de predicción (13), se pueden calcular los otros valores representativos, tales como el valor central, el valor mínimo y el valor máximo, a partir de elementos.
Una matriz predicha de un tamaño más pequeño se puede calcular a partir de una matriz de cuantificación de un tamaño más grande. También en un caso como este, la sección de cálculo de diferencias 154 calcula una matriz de diferencias que representa una diferencia entre la matriz predicha suministrada desde la sección de predicción 152 y la matriz de cuantificación correspondiente y suministra información de matriz de diferencias que representa la matriz de diferencias calculada a la sección de codificación sin pérdidas 16. La sección de generación de matrices 210 de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 genera una matriz de cuantificación de un tamaño más pequeño a partir de la matriz de cuantificación especificada en la información de matriz básica usando cualquiera de las expresiones de predicción descritas anteriormente y la información de matriz de diferencias.
Las figuras 13A y 13B son diagramas de flujo que ilustran un ejemplo de un flujo de proceso de codificación de acuerdo con una modificación. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.
Con referencia a la figura 13A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en esta secuencia (la etapa S300). Como ejemplo, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 x 4, de 8 x 8, de 16 x 16 y de 32 x 32.
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S302). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 32 x 32 con el indicador de tipo de matriz establecido a 1 (la etapa S306). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S308).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S312). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 16 x 16 a partir de la matriz de cuantificación de 32 x 32 de acuerdo con la expresión de predicción (12) o (13) descrita anteriormente (la etapa S314). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 x 16 y la matriz predicha calculada (la etapa S316). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S318).
Con referencia a la figura 13B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S322). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 8 x 8 a partir de la matriz de cuantificación de 16 x 16 (la etapa S324). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 x 8 y la matriz predicha calculada (la etapa S326). Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S328).
La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 * 4 es una definida por el usuario (la etapa S332). Si la matriz de cuantificación de 4 * 4 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 4 * 4 a partir de la matriz de cuantificación de 8 * 8 (la etapa S334). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 4 * 4 y la matriz predicha calculada (la etapa S336). Si la matriz de cuantificación de 4 * 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S338).
Si se usa el SPS para definir matrices de cuantificación, la modificación puede calcular y codificar matrices predichas en orden descendente de los tamaños de matriz de cuantificación. Si se usa el PPS para actualizar matrices de cuantificación, la modificación también puede calcular y codificar matrices predichas en orden descendente de los tamaños de matriz de cuantificación.
Las figuras 14A y 14B son diagramas de flujo que ilustran un ejemplo de un flujo de proceso de descodificación de acuerdo con la realización. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.
Con referencia a la figura 14A, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz contenido en el conjunto de parámetros de secuencia de la secuencia para determinar si la matriz de cuantificación de 32 * 32 es una definida por el usuario (la etapa S402). Si la matriz de cuantificación de 32 * 32 es una definida por el usuario, la sección de generación de matrices 210 usa la información de matriz básica para establecer la matriz de cuantificación de 32 * 32, en concreto, almacenar la misma en la memoria intermedia de matrices de cuantificación 220 (la etapa S404). Si la matriz de cuantificación de 32 * 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 * 32 por defecto (la etapa S406).
La sección de generación de matrices 210 determina si una matriz de cuantificación de 16 * 16 es una definida por el usuario (la etapa S412). Si la matriz de cuantificación de 16 * 16 es una definida por el usuario, la sección de generación de matrices 210 usa la expresión de predicción (12) o (13) descrita anteriormente para calcular una matriz predicha de 16 * 16 a partir de la matriz de cuantificación de 32 * 32 y añade la matriz predicha calculada a una matriz de diferencias de 16 * 16. Como resultado, se reconstruye la matriz de cuantificación de 16 * 16 (la etapa S414). Si el indicador de diferencia de 16 * 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 * 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 * 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 * 16 por defecto (la etapa S416).
Con referencia a la figura 14B, la sección de generación de matrices 210 determina si una matriz de cuantificación de 8 * 8 es una definida por el usuario (la etapa S422). Si la matriz de cuantificación de 8 * 8 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 8 * 8 a partir de la matriz de cuantificación de 16 * 16 y añade la matriz predicha calculada a una matriz de diferencias de 8 * 8. Como resultado, se reconstruye la matriz de cuantificación de 8 * 8 (la etapa S424). Si el indicador de diferencia de 8 * 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 * 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 * 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 * 8 por defecto (la etapa S426).
La sección de generación de matrices 210 determina si una matriz de cuantificación de 4 * 4 es una definida por el usuario (la etapa S432). Si la matriz de cuantificación de 4 * 4 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 4 * 4 a partir de la matriz de cuantificación de 8 * 8 y añade la matriz predicha calculada a una matriz de diferencias de 4 * 4. Como resultado, se reconstruye la matriz de cuantificación de 4 * 4 (la etapa S434). Si el indicador de diferencia de 4 * 4 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 4 * 4 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 4 * 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 * 4 por defecto (la etapa S436).
Si se usa el SPS para descodificar matrices de cuantificación, la modificación puede reconstruir matrices de cuantificación en orden descendente de los tamaños de matriz de cuantificación. Si se usa el PPS para actualizar matrices de cuantificación, la modificación también puede reconstruir matrices de cuantificación en orden descendente de los tamaños de matriz de cuantificación.
<6. Aplicaciones de ejemplo>
El dispositivo de codificación de imágenes 10 y el dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente, se pueden aplicar a diversos aparatos electrónicos tales como un transmisor y un receptor para radiodifusión por satélite, radiodifusión por cable tal como TV por cable, distribución por Internet, distribución a terminales a través de comunicación celular, y similares, un dispositivo de registro que registra imágenes en un medio tal como en un disco óptico, un disco magnético o una memoria flash, un dispositivo de reproducción que reproduce imágenes desde tal medio de almacenamiento, y similares. A continuación se describen cuatro aplicaciones de ejemplo.
[6-1. Primera aplicación de ejemplo]
La figura 15 es un diagrama de bloques que muestra un ejemplo de una configuración esquemática de un televisor que adopta la realización descrita anteriormente. Un televisor 900 incluye una antena 901, un sintonizador 902, un desmultiplexor 903, un descodificador 904, una sección de procesamiento de señales de vídeo 905, una sección de visualización 906, una sección de procesamiento de señales de audio 907, un altavoz 908, una interfaz externa 909, una sección de control 910, una interfaz de usuario 911 y un bus 912.
El sintonizador 902 extrae de unas señales de radiodifusión recibidas a través de la antena 901 una señal de un canal deseado, y desmodula la señal extraída. Entonces, el sintonizador 902 emite al desmultiplexor 903 un flujo de bits codificado obtenido mediante desmodulación. Es decir, el sintonizador 902 sirve como medios de transmisión de los televisores 900 para recibir un flujo codificado en el que se codifica una imagen.
El desmultiplexor 903 separa del flujo de bits codificado un flujo de vídeo y un flujo de audio de un programa a visualizar, y emite cada flujo que ha sido separado al descodificador 904. Asimismo, el desmultiplexor 903 extrae datos auxiliares tales como una EPG (guía electrónica de programas) del flujo de bits codificado y suministra los datos extraídos a la sección de control 910. Además, el desmultiplexor 903 puede realizar una desaleatorización en el caso de que el flujo de bits codificado esté aleatorizado.
El descodificador 904 descodifica el flujo de vídeo y el flujo de audio introducidos desde el desmultiplexor 903. Entonces, el descodificador 904 emite datos de vídeo generados por el proceso de descodificación a la sección de procesamiento de señales de vídeo 905. Asimismo, el descodificador 904 emite los datos de audio generados por el proceso de descodificación a la sección de procesamiento de señales de audio 907.
La sección de procesamiento de señales de vídeo 905 reproduce los datos de vídeo introducidos desde el descodificador 904 y hace que la sección de visualización 906 visualice el vídeo. La sección de procesamiento de señales de vídeo 905 también puede hacer que la sección de visualización 906 visualice una pantalla de aplicación suministrada a través de una red. Además, la sección de procesamiento de señales de vídeo 905 puede realizar un proceso adicional tal como eliminación de ruido, por ejemplo, sobre los datos de vídeo de acuerdo con el ajuste. Además, la sección de procesamiento de señales de vídeo 905 puede generar una imagen de una GUI (interfaz gráfica de usuario) tal como, por ejemplo, un menú, un botón, un cursor o similar, y superponer la imagen generada a una imagen de salida.
La sección de visualización 906 es controlada por una señal de control suministrada por la sección de procesamiento de señales de vídeo 905, y visualiza un vídeo o una imagen en una pantalla de vídeo de un dispositivo de visualización (por ejemplo, un visualizador de cristal líquido, un visualizador de plasma, un OLED, o similar).
La sección de procesamiento de señales de audio 907 realiza procesos de reproducción tales como conversión D/A y amplificación sobre los datos de audio introducidos desde el descodificador 904, y emite audio a través del altavoz 908. Asimismo, la sección de procesamiento de señales de audio 907 puede realizar un proceso adicional tal como la eliminación de ruido sobre los datos de audio.
La interfaz externa 909 es una interfaz para conectar el televisor 900 a un aparato externo o a una red. Por ejemplo, un flujo de vídeo o un flujo de audio recibido a través de la interfaz externa 909 puede ser descodificado por el descodificador 904. Es decir, la interfaz externa 909 también sirve como medios de transmisión de los televisores 900 para recibir un flujo codificado en el que se codifica una imagen.
La sección de control 910 incluye un procesador tal como una CPU (Unidad Central de Procesamiento), y una memoria tal como una RAM (Memoria de Acceso Aleatorio), una ROM (Memoria de Solo Lectura), o similar. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa, datos de EPG, datos adquiridos a través de una red, y similares. El programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del televisor 900, por ejemplo. La CPU controla el funcionamiento del televisor 900 de acuerdo con una señal de operación introducida desde la interfaz de usuario 911, por ejemplo, ejecutando el programa.
La interfaz de usuario 911 se conecta a la sección de control 910. La interfaz de usuario 911 incluye un botón y un conmutador usados por un usuario para hacer funcionar el televisor 900, y una sección de recepción para una señal de control remoto, por ejemplo. La interfaz de usuario 911 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 910.
El bus 912 interconecta el sintonizador 902, el desmultiplexor 903, el descodificador 904, la sección de procesamiento de señales de vídeo 905, la sección de procesamiento de señales de audio 907, la interfaz externa 909 y la sección de control 910.
En el televisor 900 configurado de esta forma, el descodificador 904 tiene una función del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, también en el caso de la descodificación de imágenes en el televisor 900, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
[6-2. Segunda aplicación de ejemplo]
La figura 16 es un diagrama de bloques que muestra un ejemplo de una configuración esquemática de un teléfono móvil que adopta la realización descrita anteriormente. Un teléfono móvil 920 incluye una antena 921, una sección de comunicación 922, un códec de audio 923, un altavoz 924, un micrófono 925, una sección de cámara 926, una sección de procesamiento de imágenes 927, una sección de desmultiplexación 928, una sección de registro/reproducción 929, una sección de visualización 930, una sección de control 931, una sección de operación 932 y un bus 933.
La antena 921 se conecta a la sección de comunicación 922. El altavoz 924 y el micrófono 925 se conectan al códec de audio 923. La sección de operación 932 se conecta a la sección de control 931. El bus 933 interconecta la sección de comunicación 922, el códec de audio 923, la sección de cámara 926, la sección de procesamiento de imágenes 927, la sección de desmultiplexación 928, la sección de registro/reproducción 929, la sección de visualización 930 y la sección de control 931.
El teléfono móvil 920 realiza operaciones tales como la transmisión/recepción de la señal de audio, la transmisión/recepción de correos electrónicos o datos de imagen, la captura de imágenes, el registro de datos, etc., en diversos modos de operación que incluyen un modo de comunicación de audio, un modo de comunicación de datos, un modo de captura de imágenes y un modo de videoteléfono.
En el modo de comunicación de audio, se suministra una señal de audio analógica generada por el micrófono 925 al códec de audio 923. El códec de audio 923 convierte la señal de audio analógica en datos de audio, y realiza una conversión A/D y comprime los datos de audio convertidos. Entonces, el códec de audio 923 emite los datos de audio comprimidos a la sección de comunicación 922. La sección de comunicación 922 codifica y modula los datos de audio y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida y genera datos de audio, y emite los datos de audio generados al códec de audio 923. El códec de audio 923 extiende y convierte de digital a analógico los datos de audio y genera una señal de audio analógica. Entonces, el códec de audio 923 suministra la señal de audio generada al altavoz 924 y hace que se emita el audio.
Asimismo, en el modo de comunicación de datos, la sección de control 931 genera datos de texto que conforman un correo electrónico, de acuerdo con una operación de un usuario a través de la sección de operación 932, por ejemplo. Además, la sección de control 931 hace que el texto se visualice en la sección de visualización 930. Además, la sección de control 931 genera datos de correo electrónico de acuerdo con una instrucción de transmisión del usuario a través de la sección de operación 932, y emite los datos de correo electrónico generados a la sección de comunicación 922. Entonces, la sección de comunicación 922 codifica y modula los datos del correo electrónico y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida, restablece los datos de correo electrónico y emite los datos de correo electrónico restablecidos a la sección de control 931. La sección de control 931 hace que la sección de visualización 930 visualice el contenido del correo electrónico, y también hace que los datos del correo electrónico se almacenen en el medio de almacenamiento de la sección de registro/reproducción 929.
La sección de registro/reproducción 929 incluye un medio de almacenamiento arbitrario legible y grabable. Por ejemplo, el medio de almacenamiento puede ser un medio de almacenamiento integrado tal como una RAM, una memoria flash o similar, o un medio de almacenamiento montado externamente tal como un disco duro, un disco magnético, un disco magneto-óptico, un disco óptico, una memoria de USB, una tarjeta de memoria, o similar.
Además, en el modo de captura de imágenes, la sección de cámara 926 captura una imagen de un sujeto, genera datos de imagen y emite los datos de imagen generados a la sección de procesamiento de imágenes 927, por ejemplo. La sección de procesamiento de imágenes 927 codifica los datos de imagen introducidos desde la sección de cámara 926 y hace que el flujo codificado se almacene en el medio de almacenamiento de la sección de registro/reproducción 929.
Además, en el modo de videoteléfono, la sección de desmultiplexación 928 multiplexa un flujo de vídeo codificado por la sección de procesamiento de imágenes 927 y un flujo de audio introducido desde el códec de audio 923, y emite el flujo multiplexado a la sección de comunicación 922, por ejemplo. La sección de comunicación 922 codifica y modula el flujo y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Estas señales de transmisión y de recepción pueden incluir un flujo de bits codificado. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida, restablece el flujo y emite el flujo restablecido a la sección de desmultiplexación 928. La sección de desmultiplexación 928 separa del flujo de entrada un flujo de vídeo y un flujo de audio, y emite el flujo de vídeo a la sección de procesamiento de imágenes 927 y el flujo de audio al códec de audio 923. La sección de procesamiento de imágenes 927 descodifica el flujo de vídeo y genera datos de vídeo. Los datos de vídeo se suministran a la sección de visualización 930, y una serie de imágenes es visualizada por la sección de visualización 930. El códec de audio 923 extiende y convierte de digital a analógico el flujo de audio y genera una señal de audio analógica. Entonces, el códec de audio 923 suministra la señal de audio generada al altavoz 924 y hace que se emita el audio.
En el teléfono móvil 920 configurado de esta forma, la sección de procesamiento de imágenes 927 tiene una función del dispositivo de codificación de imágenes 10 y del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, también en el caso de la descodificación y codificación de imágenes en el teléfono móvil 920, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
[6-3. Tercera aplicación de ejemplo]
La figura 17 es un diagrama de bloques que muestra un ejemplo de configuración esquemática de un dispositivo de registro/reproducción que adopta la realización descrita anteriormente. Un dispositivo de registro/reproducción 940 codifica y registra en un medio de registro, por ejemplo, datos de audio y datos de vídeo de un programa de radiodifusión recibido. El dispositivo de registro/reproducción 940 también puede codificar y registrar en el medio de registro, por ejemplo, datos de audio y datos de vídeo adquiridos desde otro dispositivo. Además, el dispositivo de registro/reproducción 940 reproduce, mediante un monitor o un altavoz, datos registrados en el medio de registro, de acuerdo con instrucciones de un usuario, por ejemplo. En este momento, el dispositivo de registro/reproducción 940 descodifica los datos de audio y de vídeo.
El dispositivo de registro/reproducción 940 incluye un sintonizador 941, una interfaz externa 942, un codificador 943, una HDD (unidad de disco duro) 944, una unidad de disco 945, un selector 946, un descodificador 947, una OSD (Visualización en Pantalla) 948, una sección de control 949 y una interfaz de usuario 950.
El sintonizador 941 extrae de unas señales de radiodifusión recibidas a través de una antena (no mostrada) una señal de un canal deseado, y desmodula la señal extraída. Entonces, el sintonizador 941 emite al selector 946 un flujo de bits codificado obtenido mediante desmodulación. Es decir, el sintonizador 941 sirve como medios de transmisión del dispositivo de registro/reproducción 940.
La interfaz externa 942 es una interfaz para conectar el dispositivo de registro/reproducción 940 y un aparato externo o una red. Por ejemplo, la interfaz externa 942 puede ser una interfaz de IEEE 1394, una interfaz de red, una interfaz de USB, una interfaz de memoria flash o similar. Por ejemplo, los datos de vídeo y datos de audio recibidos por la interfaz externa 942 se introducen en el codificador 943. Es decir, la interfaz externa 942 sirve como medios de transmisión del dispositivo de registro/reproducción 940.
En el caso de que los datos de vídeo y los datos de audio introducidos desde la interfaz externa 942 no estén codificados, el codificador 943 codifica los datos de vídeo y los datos de audio. Entonces, el codificador 943 emite el flujo de bits codificado al selector 946.
La HDD 944 registra en un disco duro interno un flujo de bits codificado, que son datos de contenido comprimido de un vídeo o audio, diversos programas y otras porciones de datos. Asimismo, la HDD 944 lee estas porciones de datos del disco duro en el momento de reproducir un vídeo o audio.
La unidad de disco 945 registra o lee datos en un medio de registro que está montado. Un medio de registro que se monta en la unidad de disco 945 puede ser un disco DVD (un DVD-Video, un DVD-RAM, un DVD-R, un DVD-RW, un DVD+, un DVD+RW, o similar), un disco Blu-ray (marca comercial registrada), o similar, por ejemplo.
El selector 946 selecciona, en el momento de registrar un vídeo o audio, un flujo de bits codificado introducido desde el sintonizador 941 o del codificador 943, y emite el flujo de bits codificado seleccionado a la HDD 944 o a la unidad de disco 945. Asimismo, el selector 946 emite al descodificador 947, en el momento de reproducir un vídeo o audio, un flujo de bits codificado introducido desde la HDD 944 o de la unidad de disco 945.
El descodificador 947 descodifica el flujo de bits codificado y genera datos de vídeo y datos de audio. Entonces, el descodificador 947 emite los datos de vídeo generados a la OSD 948. Asimismo, el descodificador 904 emite los datos de audio generados a un altavoz externo.
La OSD 948 reproduce los datos de vídeo introducidos desde el descodificador 947 y visualiza un vídeo. Asimismo, la OSD 948 puede superponer una imagen de una GUI, tal como un menú, un botón, un cursor o similar, por ejemplo, en un vídeo visualizado.
La sección de control 949 incluye un procesador tal como una CPU, y una memoria tal como una RAM o una ROM. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa y similares. Un programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del dispositivo de registro/reproducción 940, por ejemplo. La CPU controla el funcionamiento del dispositivo de registro/reproducción 940 de acuerdo con una señal de operación introducida desde la interfaz de usuario 950, por ejemplo, ejecutando el programa.
La interfaz de usuario 950 se conecta a la sección de control 949. La interfaz de usuario 950 incluye un botón y un conmutador usados por un usuario para hacer funcionar el dispositivo de registro/reproducción 940, y una sección de recepción para una señal de control remoto, por ejemplo. La interfaz de usuario 950 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 949.
En el dispositivo de registro/reproducción 940 configurado de esta forma, el codificador 943 tiene una función del dispositivo de codificación de imágenes 10 de acuerdo con la realización descrita anteriormente. Asimismo, el descodificador 947 tiene una función del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, también en el caso de la descodificación y codificación de imágenes en el dispositivo de registro/reproducción 940, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
[6-4. Cuarta aplicación de ejemplo]
La figura 18 es un diagrama de bloques que muestra un ejemplo de configuración esquemática de un dispositivo de captura de imágenes que adopta la realización descrita anteriormente. Un dispositivo de captura de imágenes 960 captura una imagen de un sujeto, genera una imagen, codifica los datos de imagen y registra los datos de imagen en un medio de registro.
El dispositivo de captura de imágenes 960 incluye un bloque óptico 961, una sección de captura de imágenes 962, una sección de procesamiento de señales 963, una sección de procesamiento de imágenes 964, una sección de visualización 965, una interfaz externa 966, una memoria 967, una unidad de medios 968, una OSD 969, una sección de control 970, una interfaz de usuario 971 y un bus 972.
El bloque óptico 961 se conecta a la sección de captura de imágenes 962. La sección de captura de imágenes 962 se conecta a la sección de procesamiento de señales 963. La sección de visualización 965 se conecta a la sección de procesamiento de imágenes 964. La interfaz de usuario 971 se conecta a la sección de control 970. El bus 972 interconecta la sección de procesamiento de imágenes 964, la interfaz externa 966, la memoria 967, la unidad de medios 968, la OSD 969 y la sección de control 970.
El bloque óptico 961 incluye una lente de enfoque, un mecanismo de parada de apertura y similares. El bloque óptico 961 forma una imagen óptica de un sujeto sobre una superficie de captura de imágenes de la sección de captura de imágenes 962. La sección de captura de imágenes 962 incluye un sensor de imagen tal como un CCD, un CMOS o similar, y convierte por conversión fotoeléctrica la imagen óptica formada en la superficie de captura de imágenes en una señal de imagen que es una señal eléctrica. Entonces, la sección de captura de imágenes 962 emite la señal de imagen a la sección de procesamiento de señales 963.
La sección de procesamiento de señales 963 realiza diversos procesos de señal de cámara, tales como corrección de inflexión, corrección de gamma, corrección de color y similares, en la señal de imagen introducida desde la sección de captura de imágenes 962. La sección de procesamiento de señales 963 emite los datos de imagen después del proceso de señal de cámara a la sección de procesamiento de imágenes 964.
La sección de procesamiento de imágenes 964 codifica los datos de imagen introducidos desde la sección de procesamiento de señales 963, y genera datos codificados. Entonces, la sección de procesamiento de imágenes 964 emite los datos codificados generados a la interfaz externa 966 o a la unidad de medios 968. Asimismo, la sección de procesamiento de imágenes 964 descodifica datos codificados introducidos desde la interfaz externa 966 o la unidad de medios 968 y genera datos de imagen. Entonces, la sección de procesamiento de imágenes 964 emite los datos de imagen generados a la sección de visualización 965. Asimismo, la sección de procesamiento de imágenes 964 puede emitir los datos de imagen introducidos desde la sección de procesamiento de señales 963 a la sección de visualización 965, y hacer que se visualice o muestre la imagen. Además, la sección de procesamiento de imágenes 964 puede superponer datos para su visualización adquiridos desde la OSD 969 sobre una imagen a emitir a la sección de visualización 965.
La OSD 969 genera una imagen de una GUI, tal como un menú, un botón, un cursor o similar, por ejemplo, y emite la imagen generada a la sección de procesamiento de imágenes 964.
La interfaz externa 966 está configurada como un terminal de entrada/salida de USB, por ejemplo. La interfaz externa 966 conecta el dispositivo de captura de imágenes 960 y una impresora en el momento de imprimir una imagen, por ejemplo. Asimismo, se conecta una unidad a la interfaz externa 966 según sea necesario. Un medio extraíble, tal como un disco magnético, un disco óptico o similar, por ejemplo, se monta en la unidad, y un programa leído del medio extraíble se puede instalar en el dispositivo de captura de imágenes 960. Además, la interfaz externa 966 se puede configurar como una interfaz de red para conectarse a una red tal como una LAN, Internet o similar. Es decir, la interfaz externa 966 sirve como medios de transmisión del dispositivo de captura de imágenes 960.
Un medio de registro a montar en la unidad de medios 968 puede ser un medio extraíble legible y grabable arbitrario, tal como un disco magnético, un disco magneto-óptico, un disco óptico, una memoria de semiconductores o similar, por ejemplo. Asimismo, un medio de registro se puede montar de forma fija en la unidad de medios 968, configurando una sección de almacenamiento no transportable tal como, por ejemplo, una unidad de disco duro integrada o una SSD (unidad de estado sólido).
La sección de control 970 incluye un procesador tal como una CPU, y una memoria tal como una RAM o una ROM. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa y similares. Un programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del dispositivo de captura de imágenes 960, por ejemplo. La CPU controla el funcionamiento del dispositivo de captura de imágenes 960 de acuerdo con una señal de operación introducida desde la interfaz de usuario 971, por ejemplo, ejecutando el programa.
La interfaz de usuario 971 se conecta a la sección de control 970. La interfaz de usuario 971 incluye un botón, un conmutador y similares usados por un usuario para hacer funcionar el dispositivo de captura de imágenes 960, por ejemplo. La interfaz de usuario 971 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 970.
En el dispositivo de captura de imágenes 960 configurado de esta forma, la sección de procesamiento de imágenes 964 tiene una función del dispositivo de codificación de imágenes 10 y del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, en el caso de la descodificación y codificación de imágenes en el dispositivo de captura de imágenes 960, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.
<7. En resumen>
Se han descrito el dispositivo de codificación de imágenes 10 y el dispositivo de descodificación de imágenes 60 de acuerdo con una realización con referencia a las figuras 1 a 18. La realización usa la técnica de predicción para generar una segunda matriz de cuantificación que corresponde a una unidad de transformación que representa un segundo tamaño a partir de una primera matriz de cuantificación que corresponde a una unidad de transformación que representa un primer tamaño si múltiples matrices de cuantificación corresponden a múltiples unidades de transformación que representan diferentes tamaños. Esto puede eliminar la necesidad de codificar la totalidad de la segunda matriz de cuantificación. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.
La realización genera la segunda matriz de cuantificación usando la información de matriz que especifica la primera matriz de cuantificación y la información de diferencias (información de matriz de diferencias) que representa una diferencia entre una matriz predicha y la segunda matriz de cuantificación. Por lo tanto, es posible adquirir la segunda matriz de cuantificación apropiada para el lado de descodificación de imágenes simplemente codificando solo una diferencia entre la segunda matriz de cuantificación y una matriz predicha.
De acuerdo con la realización, un primer indicador puede indicar la ausencia de una diferencia entre una matriz predicha y la segunda matriz de cuantificación y se puede adquirir del conjunto de parámetros de secuencia o del conjunto de parámetros de imagen. En un caso como este, se supone que una matriz predicha que se ha predicho a partir de la segunda matriz de cuantificación es la segunda matriz de cuantificación. En este caso, la cantidad de códigos se puede reducir adicionalmente debido a que ni siquiera se codifica información de diferencias para la segunda matriz de cuantificación.
La primera matriz de cuantificación puede tener el mínimo de los tamaños de unidad de transformación. La configuración descrita anteriormente no necesita codificar todas las matrices de cuantificación que no sean la matriz de cuantificación que tiene el tamaño mínimo. Por lo tanto, un aumento en la cantidad de códigos se puede moderar de forma más eficaz incluso si aumenta el número de matrices de cuantificación.
En esta memoria descriptiva se ha descrito cómo se multiplexa información para generar una matriz de cuantificación en un encabezamiento de un flujo codificado y se transmite desde el lado de codificación al lado de descodificación. Sin embargo, una técnica de transmisión de información usada para transmitir tal información no se limita a la técnica descrita anteriormente. Por ejemplo, la información no se puede multiplexar para dar un flujo de bits codificado, pero se puede transmitir o registrar como datos separados asociados con el flujo de bits codificado. El término "asociación" significa garantizar la posibilidad de vincular una imagen (o parte de una imagen, tal como un sector o un bloque) contenida en el flujo de bits con información correspondiente a la imagen. En concreto, la información se puede transmitir a través de una trayectoria de transmisión diferente de la usada para imágenes (o flujos de bits). La información se puede registrar en un medio de registro (o en un área de registro diferente en el mismo medio de registro) diferente de la usada para imágenes (o flujos de bits). La información y la imagen (o flujo de bits) se pueden asociar entre sí basándose en cualquier unidad tal como múltiples tramas, una trama o parte de una trama.
Las realizaciones preferidas de la presente invención se han descrito anteriormente con referencia a los dibujos adjuntos aunque, por supuesto, la presente invención no se limita a los ejemplos anteriores. Un experto en la materia puede hallar diversas alternancias y modificaciones dentro del alcance de las reivindicaciones adjuntas, y se debería entender que, naturalmente, las mismas entrarán dentro del alcance técnico de la presente invención.
Lista de signos de referencia
10 Dispositivo de procesamiento de imágenes (dispositivo de codificación de imágenes)
16 Sección de codificación
110 Sección de selección
120 Sección de transformación ortogonal
130 Sección de cuantificación
60 Dispositivo de procesamiento de imágenes (dispositivo de descodificación de imágenes)
210 Sección de generación de matrices
230 Sección de selección
240 Sección de cuantificación inversa
250 Sección de transformación ortogonal inversa

Claims (11)

REIVINDICACIONES
1. Un dispositivo de procesamiento de imágenes (10) que comprende:
una unidad configurada para:
descodificar datos codificados de datos de imagen para generar datos de coeficientes de transformación cuantificados; y
cuantificar inversamente los datos de coeficientes de transformación cuantificados para los datos de imagen usando una matriz de cuantificación de 32 x 32, mediante lo cual
la unidad está configurada además para generar la matriz de cuantificación de 32 x 32 duplicando cada elemento en una matriz de cuantificación de 16 x 16 obtenida duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 32 x 32;
en donde, para un elemento en la matriz de cuantificación de 8 x 8, los elementos duplicados que se duplican a partir de ese elemento se sitúan en la matriz de cuantificación de 32 x 32 de la siguiente forma:
un primer elemento duplicado de los elementos duplicados se sitúa adyacente a un elemento y a la derecha del elemento;
un segundo elemento duplicado de los elementos duplicados se sitúa adyacente al elemento y por debajo del elemento;
un tercer elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y por debajo del primer elemento duplicado y adyacente al segundo elemento duplicado y a la derecha del segundo elemento duplicado;
un cuarto elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y a la derecha del primer elemento duplicado;
un quinto elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y a la derecha del tercer elemento duplicado;
un sexto elemento duplicado de los elementos duplicados se sitúa adyacente al segundo elemento duplicado y por debajo del segundo elemento duplicado;
un séptimo elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y por debajo del tercer elemento duplicado;
un octavo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y por debajo del quinto elemento duplicado y adyacente al séptimo elemento duplicado y a la derecha del séptimo elemento duplicado;
un noveno elemento duplicado de los elementos duplicados se sitúa adyacente al cuarto elemento duplicado y a la derecha del cuarto elemento duplicado;
un décimo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y a la derecha del quinto elemento duplicado;
un decimoprimer elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y a la derecha del octavo elemento duplicado;
un decimosegundo elemento duplicado de los elementos duplicados se sitúa adyacente al sexto elemento duplicado y por debajo del sexto elemento duplicado;
un decimotercer elemento duplicado de los elementos duplicados se sitúa adyacente al séptimo elemento duplicado y por debajo del séptimo elemento duplicado;
un decimocuarto elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y debajo del octavo elemento duplicado;
un decimoquinto elemento duplicado de los elementos duplicados se sitúa adyacente al decimoprimer elemento duplicado y por debajo del decimoprimer elemento duplicado y adyacente al decimocuarto elemento duplicado y a la derecha del decimocuarto elemento duplicado.
2. El dispositivo de procesamiento de imágenes de acuerdo con la reivindicación 1, en donde la matriz de cuantificación de 8 x 8 es una matriz de cuantificación por defecto.
3. El dispositivo de procesamiento de imágenes de acuerdo con la reivindicación 1, en donde la unidad está configurada para almacenar la matriz de cuantificación de 8 x 8.
4. El dispositivo de procesamiento de imágenes de acuerdo con la reivindicación 1, en donde la unidad está configurada para cuantificar inversamente los datos de coeficientes de transformación cuantificados para los datos de imagen usando la matriz de cuantificación de 32 x 32 (QM1) establecida duplicando los elementos en la matriz de cuantificación de 8 x 8 (QM2), en donde:
QM1 =
Figure imgf000027_0001
y QM2 =
Figure imgf000027_0002
5. El dispositivo de procesamiento de imágenes de acuerdo con la reivindicación 4, en donde la unidad está configurada para establecer la matriz de cuantificación de 32 x 32.
6. Un método de procesamiento de imágenes que comprende:
descodificar datos codificados de datos de imagen para generar datos de coeficientes de transformación cuantificados; y
cuantificar inversamente, a través de una unidad de un dispositivo de procesamiento de imágenes (10), los datos de coeficientes de transformación cuantificados para los datos de imagen usando una matriz de cuantificación de 32 x 32;
generándose la matriz de cuantificación de 32 x 32 duplicando cada elemento en una matriz de cuantificación de 16 x 16 obtenida duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 32 x 32;
en donde, para un elemento en la matriz de cuantificación de 8 x 8, los elementos duplicados que se duplican a partir de ese elemento se sitúan en la matriz de cuantificación de 32 x 32 de la siguiente forma:
un primer elemento duplicado de los elementos duplicados se sitúa adyacente a un elemento y a la derecha del elemento;
un segundo elemento duplicado de los elementos duplicados se sitúa adyacente al elemento y por debajo del elemento;
un tercer elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y por debajo del primer elemento duplicado y adyacente al segundo elemento duplicado y a la derecha del segundo elemento duplicado;
un cuarto elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y a la derecha del primer elemento duplicado;
un quinto elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y a la derecha del tercer elemento duplicado;
un sexto elemento duplicado de los elementos duplicados se sitúa adyacente al segundo elemento duplicado y por debajo del segundo elemento duplicado;
un séptimo elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y por debajo del tercer elemento duplicado;
un octavo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y por debajo del quinto elemento duplicado y adyacente al séptimo elemento duplicado y a la derecha del séptimo elemento duplicado;
un noveno elemento duplicado de los elementos duplicados se sitúa adyacente al cuarto elemento duplicado y a la derecha del cuarto elemento duplicado;
un décimo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y a la derecha del quinto elemento duplicado;
un decimoprimer elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y a la derecha del octavo elemento duplicado;
un decimosegundo elemento duplicado de los elementos duplicados se sitúa adyacente al sexto elemento duplicado y por debajo del sexto elemento duplicado;
un decimotercer elemento duplicado de los elementos duplicados se sitúa adyacente al séptimo elemento duplicado y por debajo del séptimo elemento duplicado;
un decimocuarto elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y debajo del octavo elemento duplicado;
un decimoquinto elemento duplicado de los elementos duplicados se sitúa adyacente al decimoprimer elemento duplicado y por debajo del decimoprimer elemento duplicado y adyacente al decimocuarto elemento duplicado y a la derecha del decimocuarto elemento duplicado.
7. El método de procesamiento de imágenes de acuerdo con la reivindicación 6, en donde la matriz de cuantificación de 8 x 8 es una matriz de cuantificación por defecto.
8. El método de procesamiento de imágenes de acuerdo con la reivindicación 6, que comprende además almacenar la matriz de cuantificación de 8 x 8.
9. El método de procesamiento de imágenes de acuerdo con la reivindicación 6, en donde cuantificar inversamente incluye cuantificar inversamente, a través de la unidad, los datos de coeficientes de transformación cuantificados para los datos de imagen usando la matriz de cuantificación de 32 x 32 (QM1) establecida duplicando los elementos en la matriz de cuantificación de 8 x 8 (QM2), en donde:
QM1 =
Figure imgf000028_0001
y QM2 =
Figure imgf000029_0001
10. El método de procesamiento de imágenes de acuerdo con la reivindicación 9, que comprende además establecer, a través de la unidad, la matriz de cuantificación de 32 x 32.
11. Un medio legible por ordenador no transitorio que almacena instrucciones que, cuando se ejecutan, hacen que un ordenador realice un método, comprendiendo el método:
descodificar datos codificados de datos de imagen para generar datos de coeficientes de transformación cuantificados; y
cuantificar inversamente los datos de coeficientes de transformación cuantificados para los datos de imagen usando una matriz de cuantificación de 32 x 32;
generándose la matriz de cuantificación de 32 x 32 duplicando cada elemento en una matriz de cuantificación de 16 x 16 obtenida duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 32 x 32;
en donde, para un elemento en la matriz de cuantificación de 8 x 8, los elementos duplicados que se duplican a partir de ese elemento se sitúan en la matriz de cuantificación de 32 x 32 de la siguiente forma:
un primer elemento duplicado de los elementos duplicados se sitúa adyacente a un elemento y a la derecha del elemento;
un segundo elemento duplicado de los elementos duplicados se sitúa adyacente al elemento y por debajo del elemento;
un tercer elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y por debajo del primer elemento duplicado y adyacente al segundo elemento duplicado y a la derecha del segundo elemento duplicado;
un cuarto elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y a la derecha del primer elemento duplicado;
un quinto elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y a la derecha del tercer elemento duplicado;
un sexto elemento duplicado de los elementos duplicados se sitúa adyacente al segundo elemento duplicado y por debajo del segundo elemento duplicado;
un séptimo elemento duplicado de los elementos duplicados se sitúa adyacente al tercer elemento duplicado y por debajo del tercer elemento duplicado;
un octavo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y por debajo del quinto elemento duplicado y adyacente al séptimo elemento duplicado y a la derecha del séptimo elemento duplicado;
un noveno elemento duplicado de los elementos duplicados se sitúa adyacente al cuarto elemento duplicado y a la derecha del cuarto elemento duplicado;
un décimo elemento duplicado de los elementos duplicados se sitúa adyacente al quinto elemento duplicado y a la derecha del quinto elemento duplicado;
un decimoprimer elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y a la derecha del octavo elemento duplicado;
un decimosegundo elemento duplicado de los elementos duplicados se sitúa adyacente al sexto elemento duplicado y por debajo del sexto elemento duplicado;
un decimotercer elemento duplicado de los elementos duplicados se sitúa adyacente al séptimo elemento duplicado y por debajo del séptimo elemento duplicado;
un decimocuarto elemento duplicado de los elementos duplicados se sitúa adyacente al octavo elemento duplicado y debajo del octavo elemento duplicado;
un decimoquinto elemento duplicado de los elementos duplicados se sitúa adyacente al decimoprimer elemento duplicado y por debajo del decimoprimer elemento duplicado y adyacente al decimocuarto elemento duplicado y a la derecha del decimocuarto elemento duplicado.
ES16181274T 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes Active ES2774909T5 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010275116 2010-12-09
JP2011049992A JP5741076B2 (ja) 2010-12-09 2011-03-08 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
ES2774909T3 ES2774909T3 (es) 2020-07-23
ES2774909T5 true ES2774909T5 (es) 2022-11-30

Family

ID=46206911

Family Applications (6)

Application Number Title Priority Date Filing Date
ES16181274T Active ES2774909T5 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES15175325.8T Active ES2607822T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES15175328.2T Active ES2607823T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES15175322.5T Active ES2607882T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES11847728.0T Active ES2599453T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES19203239T Active ES2943260T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes

Family Applications After (5)

Application Number Title Priority Date Filing Date
ES15175325.8T Active ES2607822T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES15175328.2T Active ES2607823T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES15175322.5T Active ES2607882T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES11847728.0T Active ES2599453T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
ES19203239T Active ES2943260T3 (es) 2010-12-09 2011-10-14 Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes

Country Status (22)

Country Link
US (12) US8891887B2 (es)
EP (10) EP2955922B1 (es)
JP (1) JP5741076B2 (es)
KR (9) KR101837881B1 (es)
CN (8) CN103238328B (es)
AU (1) AU2011339856B2 (es)
BR (1) BR112013013513B1 (es)
CA (4) CA2997241C (es)
CO (1) CO6710956A2 (es)
DK (1) DK3633994T3 (es)
ES (6) ES2774909T5 (es)
HK (4) HK1187179A1 (es)
HU (5) HUE061522T2 (es)
MX (2) MX336658B (es)
MY (4) MY181724A (es)
PH (3) PH12015501376A1 (es)
PL (1) PL3633994T3 (es)
PT (1) PT3633994T (es)
RU (5) RU2702046C2 (es)
SG (3) SG196853A1 (es)
WO (1) WO2012077408A1 (es)
ZA (1) ZA201304007B (es)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
JP5359657B2 (ja) 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5914962B2 (ja) 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
TWI508534B (zh) 2010-05-18 2015-11-11 Sony Corp Image processing apparatus and image processing method
HUE047906T2 (hu) 2010-06-04 2020-05-28 Sony Corp QP és delta QP kódolása egy minimális méretnél nagyobb képblokkoknál
WO2012077607A1 (ja) 2010-12-07 2012-06-14 ソニー株式会社 画像処理装置及び画像処理方法
MX2013006130A (es) 2010-12-07 2013-06-28 Sony Corp Dispositivo de procesamiento de imagenes y metodo de procesamiento de imagenes.
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP5850214B2 (ja) * 2011-01-11 2016-02-03 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
CN103780912B (zh) 2011-02-10 2017-11-24 威勒斯媒体国际有限公司 图像处理装置和图像处理方法
EP2684367A4 (en) * 2011-03-10 2014-09-24 Vidyo Inc MAINTENANCE OF A SET OF PARAMETERS IN A VIDEO CODING
US9135724B2 (en) 2011-03-11 2015-09-15 Sony Corporation Image processing apparatus and method
US9641840B2 (en) 2011-05-20 2017-05-02 Sony Corporation Processing device and image processing method for encoding and decoding image
TWI530161B (zh) 2011-06-07 2016-04-11 Sony Corp Image processing apparatus and method
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
CN113347420A (zh) 2011-06-28 2021-09-03 索尼公司 图像处理装置和图像处理方法
JP2013038768A (ja) * 2011-07-13 2013-02-21 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
WO2013032794A1 (en) 2011-08-23 2013-03-07 Mediatek Singapore Pte. Ltd. Method and system of transform block processing according to quantization matrix in video coding
CN108924564B (zh) 2011-12-19 2022-12-16 索尼公司 图像处理设备和方法
CN103765903B (zh) * 2012-01-18 2017-09-01 松下知识产权经营株式会社 图像解码装置、图像编码装置、图像解码方法及图像编码方法
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
JP6041554B2 (ja) * 2012-06-27 2016-12-07 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9510019B2 (en) 2012-08-09 2016-11-29 Google Inc. Two-step quantization and coding method and apparatus
RU2624103C2 (ru) 2012-09-06 2017-06-30 Сан Пэтент Траст Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений
JP6210368B2 (ja) * 2012-09-18 2017-10-11 サン パテント トラスト 画像復号方法および画像復号装置
US9253483B2 (en) 2012-09-25 2016-02-02 Google Technology Holdings LLC Signaling of scaling list
WO2014051962A1 (en) * 2012-09-25 2014-04-03 Motorola Mobility Llc Signaling of scaling list
US10003792B2 (en) 2013-05-27 2018-06-19 Microsoft Technology Licensing, Llc Video encoder for images
US10440365B2 (en) 2013-06-28 2019-10-08 Velos Media, Llc Methods and devices for emulating low-fidelity coding in a high-fidelity coder
US10136140B2 (en) 2014-03-17 2018-11-20 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
CN105227953A (zh) * 2014-06-11 2016-01-06 晨星半导体股份有限公司 影像编码装置、影像解码装置以及其相关编码与解码方法
US10863188B2 (en) 2014-09-19 2020-12-08 Futurewei Technologies, Inc. Method and apparatus for non-uniform mapping for quantization matrix coefficients between different sizes of quantization matrices in image/video coding
WO2016103542A1 (ja) * 2014-12-26 2016-06-30 パナソニックIpマネジメント株式会社 符号化方法、復号方法、符号化装置および復号装置
CN106416254B (zh) 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
US10136132B2 (en) * 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
CN109417621A (zh) * 2016-07-04 2019-03-01 索尼公司 图像处理装置及方法
JP6530354B2 (ja) * 2016-08-03 2019-06-12 日本電信電話株式会社 映像コンテンツ保管システム、映像コンテンツ保管方法及び映像コンテンツ保管プログラム
WO2018049549A1 (en) * 2016-09-13 2018-03-22 Mediatek Inc. Method of multiple quantization matrix sets for video coding
JP6272441B2 (ja) * 2016-11-08 2018-01-31 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
KR102476148B1 (ko) * 2016-12-28 2022-12-12 소니그룹주식회사 화상 처리 장치 및 방법
RU2659745C1 (ru) * 2017-08-28 2018-07-03 Общество с ограниченной ответственностью "Аби Продакшн" Реконструкция документа из серии изображений документа
RU2762873C2 (ru) * 2017-12-15 2021-12-23 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования изображений на основе преобразования и устройство для этого
RU2020131045A (ru) 2018-03-28 2022-03-21 Сони Корпорейшн Устройство обработки изображений и способ обработки изображений
WO2019191888A1 (zh) * 2018-04-02 2019-10-10 北京大学 环路滤波的方法、装置和计算机系统
JP2020098984A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
JP7267785B2 (ja) 2019-03-11 2023-05-02 キヤノン株式会社 画像復号装置、画像復号方法、及びプログラム
JP2020150338A (ja) * 2019-03-11 2020-09-17 キヤノン株式会社 画像復号装置、画像復号方法、及びプログラム
KR20200133185A (ko) * 2019-05-15 2020-11-26 현대자동차주식회사 영상 복호화 장치에서 이용하는 역양자화장치 및 방법
CA3162150A1 (en) 2019-11-26 2021-06-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Coding concepts for a transformed representation of a sample block
KR20220112327A (ko) 2021-02-03 2022-08-11 삼성전자주식회사 센서 장치, 및 이를 포함하는 모바일 기기

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5741730A (en) 1980-08-26 1982-03-09 Mitsubishi Electric Corp Digital input circuit
JPS5741728A (en) 1980-08-27 1982-03-09 Toshiba Corp Controlling system of data transfer
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
EP0469855B1 (en) 1990-07-31 1999-12-01 Fujitsu Limited Image data processing method and apparatus
US5875266A (en) 1990-07-31 1999-02-23 Fujitsu Limited Image data processing a method and apparatus
US7142720B1 (en) 1990-07-31 2006-11-28 Fujitsu Limited Image data processing method and apparatus
US5933538A (en) 1990-07-31 1999-08-03 Fujitsu Limited Image data processing method and apparatus
US5414469A (en) 1991-10-31 1995-05-09 International Business Machines Corporation Motion video compression system with multiresolution features
US5535020A (en) * 1992-10-15 1996-07-09 Digital Equipment Corporation Void and cluster apparatus and method for generating dither templates
JPH06284412A (ja) 1993-03-26 1994-10-07 Sony Corp 画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
JP3495766B2 (ja) * 1993-10-01 2004-02-09 テキサス インスツルメンツ インコーポレイテツド 画像処理方法
US6229927B1 (en) * 1994-09-21 2001-05-08 Ricoh Company, Ltd. Reversible embedded wavelet system implementation
TW293227B (es) 1994-11-24 1996-12-11 Victor Company Of Japan
US5691775A (en) * 1995-03-30 1997-11-25 Intel Corporation Reduction of motion estimation artifacts
US5963673A (en) * 1995-12-20 1999-10-05 Sanyo Electric Co., Ltd. Method and apparatus for adaptively selecting a coding mode for video encoding
JP4028900B2 (ja) * 1996-01-11 2007-12-26 富士通株式会社 動画像符号化装置及び動画像復号化装置
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
US5990955A (en) * 1997-10-03 1999-11-23 Innovacom Inc. Dual encoding/compression method and system for picture quality/data density enhancement
US6219642B1 (en) * 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6295089B1 (en) 1999-03-30 2001-09-25 Sony Corporation Unsampled hd MPEG video and half-pel motion compensation
US6675387B1 (en) 1999-04-06 2004-01-06 Liberate Technologies System and methods for preparing multimedia data using digital video data compression
US6556624B1 (en) * 1999-07-27 2003-04-29 At&T Corp. Method and apparatus for accomplishing multiple description coding for video
US6507614B1 (en) * 1999-10-19 2003-01-14 Sony Corporation Efficient de-quantization in a digital video decoding process using a dynamic quantization matrix for parallel computations
US6529634B1 (en) 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
US7035473B1 (en) * 2000-03-01 2006-04-25 Sharp Laboratories Of America, Inc. Distortion-adaptive visual frequency weighting
US6522784B1 (en) * 2000-04-11 2003-02-18 International Business Machines Corporation Enhanced compression of gray-level images
CN1578159B (zh) * 2000-05-09 2010-05-26 索尼公司 数据处理装置和方法
US6771703B1 (en) * 2000-06-30 2004-08-03 Emc Corporation Efficient scaling of nonscalable MPEG-2 Video
US6870885B2 (en) * 2001-05-16 2005-03-22 Qualcomm Incorporated Apparatus and method for decoding and computing a discrete cosine transform using a butterfly processor
US6876704B2 (en) * 2001-05-16 2005-04-05 Qualcomm, Incorporated Apparatus and method for encoding and computing a discrete cosine transform using a butterfly processor
US6996595B2 (en) * 2001-05-16 2006-02-07 Qualcomm Incorporated Apparatus and method for consolidating output data from a plurality of processors
US7649947B2 (en) * 2001-06-05 2010-01-19 Qualcomm Incorporated Selective chrominance decimation for digital images
US20020191695A1 (en) * 2001-06-07 2002-12-19 Irvine Ann Chris Interframe encoding method and apparatus
US6870963B2 (en) * 2001-06-15 2005-03-22 Qualcomm, Inc. Configurable pattern optimizer
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US7483581B2 (en) * 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US7630563B2 (en) * 2001-07-19 2009-12-08 Qualcomm Incorporated System and method for decoding digital image and audio data in a lossless manner
US20030021486A1 (en) * 2001-07-27 2003-01-30 Tinku Acharya Method and apparatus for image scaling
US7123655B2 (en) 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
US6856701B2 (en) 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
US20030053637A1 (en) * 2001-09-14 2003-03-20 Michael Rodemer Audio distributor
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
US7194141B1 (en) * 2002-03-20 2007-03-20 Ess Technology, Inc. Image resolution conversion using pixel dropping
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7483575B2 (en) * 2002-10-25 2009-01-27 Sony Corporation Picture encoding apparatus and method, program and recording medium
JP4189952B2 (ja) * 2002-11-22 2008-12-03 株式会社リコー 符号化復号化装置、符号化復号化用プログラム及び記憶媒体
AU2004214795B9 (en) * 2003-02-21 2009-06-04 Panasonic Intellectual Property Corporation Of America Picture coding method and picture decoding method
JP4182426B2 (ja) * 2003-10-10 2008-11-19 ソニー株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2007535191A (ja) 2004-01-30 2007-11-29 松下電器産業株式会社 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置およびプログラム
EP1655966A3 (en) 2004-10-26 2011-04-27 Samsung Electronics Co., Ltd. Apparatus and method for processing an image signal in a digital broadcast receiver
JP4739338B2 (ja) * 2005-04-13 2011-08-03 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、および動画像復号プログラム
RU2368095C1 (ru) * 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
JPWO2007094100A1 (ja) * 2006-02-13 2009-07-02 株式会社東芝 動画像符号化/復号化方法及び装置並びにプログラム
CN102611892B (zh) * 2006-03-16 2014-10-08 华为技术有限公司 在编码过程中实现自适应量化的方法及装置
CN101039421A (zh) * 2006-03-16 2007-09-19 华为技术有限公司 在编解码中的实现量化的方法和装置
US8238678B2 (en) * 2006-08-30 2012-08-07 Siemens Medical Solutions Usa, Inc. Providing representative image information
US8326068B1 (en) 2006-08-30 2012-12-04 Maxim Integrated Products, Inc. Method and apparatus for modeling quantization matrices for image/video encoding
JP4956612B2 (ja) * 2006-10-12 2012-06-20 株式会社東芝 画像符号化装置及び画像符号化方法
JP4901772B2 (ja) * 2007-02-09 2012-03-21 パナソニック株式会社 動画像符号化方法及び動画像符号化装置
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US20100086028A1 (en) 2007-04-16 2010-04-08 Kabushiki Kaisha Toshiba Video encoding and decoding method and apparatus
JP4780172B2 (ja) * 2008-10-10 2011-09-28 ソニー株式会社 情報処理装置および方法
JP5155210B2 (ja) * 2009-02-09 2013-03-06 ソニー株式会社 画像比較装置及びその方法、画像検索装置、並びにプログラム及び記録媒体
EP2216998A1 (en) * 2009-02-10 2010-08-11 Panasonic Corporation Hierarchical coding for intra
JP5136470B2 (ja) * 2009-03-06 2013-02-06 富士通株式会社 動画像符号化装置及び動画像符号化方法
US20100246688A1 (en) * 2009-03-26 2010-09-30 Apple Inc. Blind noise analysis for video compression
US8311354B2 (en) * 2009-04-23 2012-11-13 Lsi Corporation DCT-based technique with rhombus scanning for image compression
JP5274359B2 (ja) 2009-04-27 2013-08-28 三菱電機株式会社 立体映像および音声記録方法、立体映像および音声再生方法、立体映像および音声記録装置、立体映像および音声再生装置、立体映像および音声記録媒体
JP5359657B2 (ja) 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5344238B2 (ja) 2009-07-31 2013-11-20 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
EP2486517A4 (en) 2009-10-05 2014-06-11 Icvt Ltd APPARATUS AND METHODS FOR RECOMPRINTING DIGITAL IMAGES
WO2011056140A1 (en) * 2009-11-05 2011-05-12 Telefonaktiebolaget Lm Ericsson (Publ) Prediction of pixels in image coding
JP5914962B2 (ja) 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
TWI508534B (zh) 2010-05-18 2015-11-11 Sony Corp Image processing apparatus and image processing method
HUE047906T2 (hu) 2010-06-04 2020-05-28 Sony Corp QP és delta QP kódolása egy minimális méretnél nagyobb képblokkoknál
JP2012039590A (ja) * 2010-07-16 2012-02-23 Sony Corp 画像処理装置、画像処理方法、及びプログラム
US9378185B2 (en) * 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
CA2722993A1 (fr) 2010-12-01 2012-06-01 Ecole De Technologie Superieure Systeme d'ecodage video parallele multitrames et multitranches avec encodage simultane de trames predites
US9167252B2 (en) 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
MX2013006130A (es) 2010-12-07 2013-06-28 Sony Corp Dispositivo de procesamiento de imagenes y metodo de procesamiento de imagenes.
WO2012077607A1 (ja) 2010-12-07 2012-06-14 ソニー株式会社 画像処理装置及び画像処理方法
JP5741730B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
CN103780912B (zh) 2011-02-10 2017-11-24 威勒斯媒体国际有限公司 图像处理装置和图像处理方法
US9135724B2 (en) 2011-03-11 2015-09-15 Sony Corporation Image processing apparatus and method
TWI530161B (zh) 2011-06-07 2016-04-11 Sony Corp Image processing apparatus and method
CN113347420A (zh) 2011-06-28 2021-09-03 索尼公司 图像处理装置和图像处理方法
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
US10277915B2 (en) * 2011-11-07 2019-04-30 Qualcomm Incorporated Signaling quantization matrices for video coding
RU2642364C2 (ru) 2012-06-29 2018-01-24 Вилос Медиа Интернэшнл Лимитед Устройство кодирования и способ кодирования

Also Published As

Publication number Publication date
ZA201304007B (en) 2014-02-26
US9743086B2 (en) 2017-08-22
MX336658B (es) 2016-01-27
US20140064362A1 (en) 2014-03-06
EP2651134B1 (en) 2016-10-05
CN105791842B (zh) 2020-08-25
KR20190016614A (ko) 2019-02-18
KR20130137645A (ko) 2013-12-17
CA2815985C (en) 2018-11-13
EP3633994B1 (en) 2023-03-29
US20190327472A1 (en) 2019-10-24
CN105915908B (zh) 2020-02-07
KR20190133293A (ko) 2019-12-02
US11196995B2 (en) 2021-12-07
KR20190002734A (ko) 2019-01-08
EP4336827A3 (en) 2024-04-10
EP4199517B1 (en) 2024-05-15
SG196851A1 (en) 2014-02-13
US20140369619A1 (en) 2014-12-18
DK3633994T3 (da) 2023-05-01
JP5741076B2 (ja) 2015-07-01
HUE030180T2 (en) 2017-04-28
EP3113493B1 (en) 2019-12-04
CA2997244C (en) 2020-04-14
EP2651134A1 (en) 2013-10-16
EP3113493B2 (en) 2022-08-03
EP2955923A1 (en) 2015-12-16
EP4336827A2 (en) 2024-03-13
HK1219599A1 (zh) 2017-04-07
CN105791843A (zh) 2016-07-20
EP4336828A3 (en) 2024-05-01
PL3633994T3 (pl) 2023-05-29
EP2955922A1 (en) 2015-12-16
CA2997258C (en) 2020-04-14
BR112013013513A2 (pt) 2016-09-06
RU2013125499A (ru) 2014-12-10
HK1187179A1 (zh) 2014-03-28
KR20180026576A (ko) 2018-03-12
EP2651134A4 (en) 2015-03-18
EP4336828A2 (en) 2024-03-13
RU2019128527A (ru) 2021-03-11
SG196854A1 (en) 2014-02-13
US20130343451A1 (en) 2013-12-26
HUE061522T2 (hu) 2023-07-28
RU2016122546A (ru) 2018-11-29
ES2774909T3 (es) 2020-07-23
CN105791842A (zh) 2016-07-20
US20170324954A1 (en) 2017-11-09
PH12015501379A1 (en) 2015-09-28
MY181725A (en) 2021-01-05
JP2012138883A (ja) 2012-07-19
KR101837881B1 (ko) 2018-03-12
WO2012077408A1 (ja) 2012-06-14
ES2599453T3 (es) 2017-02-01
PH12015501383A1 (en) 2015-09-28
RU2016122548A (ru) 2018-11-29
US20180070085A1 (en) 2018-03-08
US20160021370A1 (en) 2016-01-21
MY181724A (en) 2021-01-05
MY181726A (en) 2021-01-05
AU2011339856B2 (en) 2015-09-17
US8768077B2 (en) 2014-07-01
CN105915908A (zh) 2016-08-31
PH12015501376B1 (en) 2015-09-28
KR102227485B1 (ko) 2021-03-16
RU2598593C2 (ru) 2016-09-27
EP2955922B1 (en) 2016-11-30
CA2997258A1 (en) 2012-06-14
EP3113493A1 (en) 2017-01-04
US10499057B2 (en) 2019-12-03
RU2016122534A (ru) 2018-11-29
RU2702046C2 (ru) 2019-10-03
AU2011339856A2 (en) 2013-07-11
KR20160108578A (ko) 2016-09-19
CA2815985A1 (en) 2012-06-14
HK1219012A1 (zh) 2017-03-17
US9185367B2 (en) 2015-11-10
RU2703976C2 (ru) 2019-10-22
US20160021371A1 (en) 2016-01-21
SG196853A1 (en) 2014-02-13
US9185368B2 (en) 2015-11-10
US20130216149A1 (en) 2013-08-22
US20140072037A1 (en) 2014-03-13
HK1219598A1 (zh) 2017-04-07
KR101837796B1 (ko) 2018-03-12
HUE031255T2 (en) 2017-07-28
PH12015501379B1 (en) 2015-09-28
PH12015501376A1 (en) 2015-09-28
EP4199518A1 (en) 2023-06-21
MY165377A (en) 2018-03-21
CN103238328B (zh) 2016-06-08
PT3633994T (pt) 2023-05-02
ES2943260T3 (es) 2023-06-12
ES2607823T3 (es) 2017-04-04
KR20160108579A (ko) 2016-09-19
US8787687B2 (en) 2014-07-22
CN105282549A (zh) 2016-01-27
RU2016122548A3 (es) 2019-08-28
CN105282552A (zh) 2016-01-27
CN105791844A (zh) 2016-07-20
AU2011339856A1 (en) 2013-06-20
KR101837880B1 (ko) 2018-03-12
EP2955921A1 (en) 2015-12-16
CN105791843B (zh) 2020-06-09
CA2997241A1 (en) 2012-06-14
US20170085876A1 (en) 2017-03-23
US8903187B2 (en) 2014-12-02
CA2997241C (en) 2021-10-19
ES2607882T3 (es) 2017-04-04
KR101837882B1 (ko) 2018-03-12
HUE030953T2 (en) 2017-06-28
EP4199517A1 (en) 2023-06-21
KR20160108577A (ko) 2016-09-19
RU2016122534A3 (es) 2019-07-29
CA2997244A1 (en) 2012-06-14
US9843805B2 (en) 2017-12-12
CN103238328A (zh) 2013-08-07
KR20210030490A (ko) 2021-03-17
RU2701121C2 (ru) 2019-09-24
US10368070B2 (en) 2019-07-30
US20140369620A1 (en) 2014-12-18
CO6710956A2 (es) 2013-07-15
EP4199518B1 (en) 2024-06-05
CN105282551A (zh) 2016-01-27
EP3633994A1 (en) 2020-04-08
US9667970B2 (en) 2017-05-30
MX2013006129A (es) 2013-06-28
EP2955921B1 (en) 2016-11-30
ES2607822T3 (es) 2017-04-04
PH12015501383B1 (en) 2015-09-28
HUE029831T2 (en) 2017-04-28
EP2955923B1 (en) 2016-11-30
RU2016122546A3 (es) 2019-07-29
US8891887B2 (en) 2014-11-18
BR112013013513B1 (pt) 2022-02-08

Similar Documents

Publication Publication Date Title
ES2774909T5 (es) Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes
JP6527263B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
AU2015218463B2 (en) Image Processing Device and Image Processing Method