BRPI0609281A2

BRPI0609281A2 - método e aparelho para decodificação de vìdeo

Info

Publication number: BRPI0609281A2
Application number: BRPI0609281-0A
Authority: BR
Inventors: Haoping Yu
Original assignee: Thomson Licensing
Priority date: 2005-04-13
Filing date: 2006-03-16
Publication date: 2010-03-09
Also published as: MY163150A; JP2013214996A; WO2006113022A1; JP2016026458A; MY158264A; WO2006112996A1; US20150071349A1; MX2007012653A; JP2016026457A; EP1872587A1; KR101278324B1; MX2007012708A; MY167744A; MY154995A; KR20080006552A; JP2008536447A; EP1869892B1; EP1872588A1; US20090052527A1; US20150271490A1

Abstract

MéTODO E APARELHO PARA DECODIFICAçãO DE VìDEO. São descritos codificadores de vídeo, decodificadores de video e métodos correspondentes. Um codificador de vídeo para codificar dados de sinal de vídeo para um bloco de imagem inclui um codificador (100) para codificar todos os componentes de cor dos dados de sinal de vídeo usando um preditor comum (315) . Um decodificador de vídeo para decodificar dados de sinal de video para um bloco de imagem inclui um decodificador (200) para decodificar todos os componentes de cor dos dados de sinal de vídeo usando um preditor comum (430) . Adicionalmente, um aparelho e método para codificar e decodificar dados de sinal para um bloco de imagem incluem um codificador e decodificador para codificar / decodificar componentes de cor dos dados de sinal de video sem aplicar uma transformada de cor residual neles. Além do mais, um codificador e decodificador de vídeo para codificar / decodificar dados de sinal de vídeo para um bloco de imagem incluem um codificador e decodificador para codificar / decodificar os dados de sinal de video usando preditores exclusivos para cada um dos componentes de cor dos dados de sinal de video.

Description

"MÉTODO E APARELHO PARA DECODIFICAÇAO DE VÍDEO"REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS

Este pedido reivindica o beneficio do pedido provisório US 60/671.255, depositado em 13 de abril de 2005, edo pedido provisório ÜS 60/700.834, depositado em 20 de julho de 2005, ambos os quais são aqui incorporados pela referência em suas respectivas integras. Além do mais, este pedido está relacionado aos pedidos de patente, documentos judiciais PU050051, PU060023, intitulados "METHOD AND APPARATUS FOR VÍDEO ENCODING"; PU060029, intitulado "METHOD ANDAPPARATUS FOR VÍDEO DECODING"; e PU050159, intitulado "METHOD AND APPARATUS FOR VÍDEO ENCODING AND DECODING", cada umdos quais é depositado concorrentemente com este.

CAMPO TÉCNICO

A presente invenção diz respeito, no geral, a codificadores e decodificadores e, mais particularmente, a métodos e aparelhos para codificação e decodificação de video.

ANTECEDENTES DA INVENÇÃO

Atualmente, o formato 4:4:4 do padrão H.264 da União Internacional de Telecomunicações, Setor de Telecomunicações (ITU-T) (doravante, o "padrão H.264") somente codifica um de três canais como luma, com os outros dois canaissendo codificados como croma usando ferramentas menos eficientes. Quando uma entrada de um codec está no formato 4:4:4com resolução completa em todos os componentes de entrada, acodificação de dois dos três componentes de entrada com oalgoritmo de codificação croma menos efetivo resulta no usode mais bits naqueles dois canais. Este problema particularé mais perceptível em intraquadros. Por exemplo, o padrãoH.264 executando no modo somente intra é menos eficiente queJPEG2k para qualidade de compressão completa em 40 dB (PSNR)e superiores.

Dessa maneira, é desejável e altamente vantajosoter métodos e aparelhos para codificação e decodificação devideo que superem as desvantagens supradescritas da tecnologia anterior.

SUMÁRIO DA INVENÇÃO

Estes e outros inconvenientes e desvantagens datecnologia anterior são abordados pela presente invenção,que é direcionada para métodos e aparelhos para codificaçãoe decodificação de video.

De acordo com um aspecto da presente invenção, éprovido um aparelho para codificar dados de sinal de videopara um bloco de imagens. O aparelho inclui um codificadorpara codificar componentes de cor dos dados de sinal de video sem aplicar uma transformada de cor residual neles.

De acordo com um outro aspecto da presente invenção, é provido um método para codificar dados de sinal devideo para um bloco de imagens. O método inclui codificarcomponentes de cor dos dados de sinal de video sem aplicaruma transformada de cor residual neles.

De acordo com um ainda outro aspecto da presenteinvenção, é provido um aparelho para decodificar dados desinal de video para um bloco de imagens. O aparelho incluium decodificador para decodificar componentes de cor dos dados de sinal de video sem aplicar uma transformada de corresidual neles.

De acordo com um ainda outro aspecto da presenteinvenção, é provido um método para decodificar dados de si-nal de video' para um bloco de imagens. 0 método inclui deco-dificar componentes de cor dos dados de sinal de video semaplicar uma transformada de cor residual neles.

Estes e outros aspectos, recursos e vantagens dapresente invenção ficarão aparentes a partir da seguintedescrição detalhada das modalidades exemplares, que deve serlida em conjunto com os desenhos anexos.

DESCRIÇÃO RESUMIDA DOS DESENHOS

A presente invenção pode ser mais bem entendida deacordo com as seguintes Figuras exemplares, nas quais:

A Figura 1 é um diagrama em blocos ilustrando umaparelho codificador de video exemplar no qual os presentesprincípios podem ser aplicados;

A Figura 2 é um diagrama em blocos ilustrando umaparelho decodificador de video exemplar no qual os presen-tes princípios podem ser aplicados;

A Figura 3 é um fluxograma ilustrando um processode codificação de video exemplar com um bloco de transforma-da de cor de pré-codif icação de acordo com os presentesprincípios;

A Figura 4 é um fluxograma ilustrando um processoexemplar de decodificação de video com um bloco de transfor-mada de cor inversa de pós-decodificação de acordo com ospresentes princípios;

A Figura 5 é um diagrama em blocos ilustrando ummodelo simplificado de transformada de cor residual (RCT);

As Figuras 6A e 6B são gráficos de PSNR médio emfunção da taxa de bit para ATV somente intra de acordo comos presentes princípios;

As Figuras 7A e 7B são gráficos de PSNR médio emfunção da taxa de bit para CT somente intra de acordo com ospresentes princípios;

As Figuras 8A e 8B são gráficos de PSNR médio emfunção da taxa de bit para DT somente intra de acordo com ospresentes princípios;

As Figuras 9A e 9B são gráficos de PSNR médio emfunção da taxa de bit para MIR_HD somente intra de acordocom os presentes princípios;

As Figuras 10A e 10B são gráficos de PSNR médio emfunção da taxa de bit para RT somente intra de acordo com ospresentes princípios;

As Figuras 11A e 11B são gráficos de PSNR médio emfunção de taxa de bit para STB_HD somente intra de acordocom os presentes princípios;

A Figura 12 é uma tabela ilustrando a sintaxe doparâmetro da seqüência H.264 de acordo com os presentesprincípios;

A Figura 13 é uma tabela ilustrando a sintaxe dedados residuais H.264 de acordo com os presentes princípios;

A Figura 14 é um fluxograma ilustrando um processode codificação de video exemplar com um bloco de transforma-da de cor de pré-codif icação de acordo com os presentesprincípios;A Figura 15 é um fluxograma ilustrando um processoexemplar de decodificação de video com um bloco de transformada de cor inversa de pós-decodificação de acordo com ospresentes princípios; e

A Figura 16 é uma tabela ilustrando a sintaxe depredição de macrobloco H.264 de acordo com os presentesprincípios.

DESCRIÇÃO DETALHADA

A presente invenção é direcionada para métodos eaparelhos para codificação e decodificação de dados de sinalde video. Percebe-se que, embora a presente invenção sejaessencialmente descrita com relação aos dados de sinal devideo amostrados usando o formato 4:4:4 do padrão H.264 daUnião Internacional de Telecomunicações, Setor de Telecomunicações (ITU-T), a presente invenção também pode ser aplicada aos dados de sinal de video amostrados usando outrosformatos (por exemplo, o formato 4:2:2 e/ou o formato 4:2:0)do padrão H.264, bem como outros padrões de compressão devideo, ao mesmo tempo em que mantém o escopo da presente invenção .

Percebe-se que métodos e aparelhos de acordo comos presentes princípios não exigem o uso de nenhuma ferramenta (s) inédita (s) para o algoritmo de compressão luma oucrorna. Em vez disto, podem ser usadas as ferramentas de codificação luma existentes. Dessa maneira, um resultado van-tajoso a partir deste ponto é que o desempenho de codificação do formato 4:4:4 pode ser maximizado ao mesmo tempo emque preserva compatibilidade com versões anteriores e mini-miza qualquer mudança do padrão H.264 existente (ou outroaplicável).

De acordo com os princípios da presente invenção,da forma configurada em uma modalidade, um algoritmo de codificação luma é usado para codificar todos os três canaiscomponentes, por exemplo, do conteúdo 4:4:4. Vantagens destamodalidade incluem uma melhoria no desempenho geral de codificação para comprimir conteúdo 4:4:4 em relação à tecnologia anterior - Atualmente, no padrão H.264 existente, somenteum dos três canais é codificado como luma, e os outros doissão codificados como çroma usando ferramentas menos eficientes.

Adicionalmente, de acordo com os princípios dapresente invenção, da forma configurada em uma modalidade, atransformada de cor é realizada como uma etapa de préprocessamento. Assim, de acordo com esta modalidade, umatransformada de cor residual (RCT) não é realizada dentro dolaço de compressão. Vantagens desta modalidade incluem aprovisão de consistente arquitetura de codificador / decodificador entre todos os formatos de cor.

Além do mais, de acordo com os princípios da presente invenção, da forma configurada em uma modalidade, omodo de predição de movimento / espacial é usado para todosos três componentes. Vantagens desta modalidade incluem baixa complexidade de codec e compatibilidade com versões anteriores .

Também, de acordo com uma outra modalidade, em vezde usar o mesmo preditor para todos os três componentes, umconjunto (ou subconjunto) de três (3) preditores espaciaisrestritos pode ser utilizado para os três componentes. Vantagens desta modalidade incluem uma melhoria no desempenhogeral de codificação para comprimir conteúdo 4:4:4 em relação à tecnologia anterior.

Percebe-se que várias modalidades supradescritase, subseqüentemente, aqui descritas, podem ser implementadascomo modalidades independentes ou podem ser combinadas dequalquer maneira da forma prontamente percebida pelos versados na técnica. Assim, por exemplo, em uma primeira modalidade combinada, um algoritmo de codificação luma é vantajosamente usado para codificar todos os três canais componentes, a transformada de cor é realizada como uma etapa depré-processamento, e um único preditor é usado para todos os três canais componentes. Em uma segunda modalidade combinada, um algoritmo de codificação luma é vantajosamente usadopara codificar todos os três canais componentes, a transformada de cor é realizada como uma etapa de pré-processamento,e um conjunto (ou subconjunto) de três (3) preditores espaciais restritos pode ser utilizado pelos três canais componentes. Certamente, da forma exposta, outras combinações devárias modalidades também podem ser implementadas dados ospreceitos dos presentes princípios aqui providos, emboramantendo o escopo da presente invenção.

A presente descrição ilustra os princípios da presente invenção. Assim, percebe-se que os versados na técnicaserão capazes de desenvolver vários arranjos que, embora nãoexplicitamente aqui descritos ou mostrados, incorporam osprincípios da invenção e estão incluídos no seu espírito eescopo.

Pretende-se que todos os exemplos e linguagem con-dicional aqui citados tenham propósitos pedagógicos para au-xiliar o leitor no entendimento dos princípios da invenção edos conceitos contribuídos pelo inventor para promover atecnologia, e que sejam interpretados sem limitações a taisexemplos e condições especificamente citados.

Além do mais, pretende-se que todas as declaraçõesaqui citando princípios, aspectos e modalidades da invenção,bem como seus exemplos específicos, abranjam tanto seus e-quivalentes estruturais quanto funcionais. Adicionalmente,pretende-se que tais equivalentes incluam tanto os equiva-lentes atualmente conhecidos bem como os equivalentes desen-volvidos no futuro, isto é, todos os elementos desenvolvidosque realizem a mesma função, independentemente da estrutura.

Assim, por exemplo, versados na técnica percebemque os diagramas em blocos aqui apresentados representam vi-sões conceituais de conjuntos de circuitos ilustrativos in-corporando os princípios da invenção. Similarmente, percebe-se que todos os fluxogramas, diagramas de fluxo, diagramasde transição de estado, pseudocódigos e semelhantes, repre-sentam vários processos que podem ser substancialmente re-presentados em meio legível por computador e, portanto, exe-cutados por um computador ou processador, esteja este compu-tador ou processador explicitamente mostrado ou não.

As funções dos vários elementos mostrados nas Fi-guras podem ser providas por meio do uso de hardware dedica-do bem como por hardware capaz de executar suporte lógico emassociação com suporte lógico apropriado. Quando providaspor um processador, as funções podem ser providas por um Cínico processador dedicado, por um único processador compartilhado, ou por uma pluralidade de processadores individu-ais , alguns dos quais podem ser compartilhados. Além dmais, o uso explicito do termo "processador" ou "controlador" não deve ser interpretado dizendo respeito exclusiva-mente a hardware capaz de executar suporte lógico e pode incluir implicitamente, sem limitações, hardware processadorde sinal digital ("DSP"), memória exclusiva de leitura("ROM") para armazenar suporte lógico, memória de acesso aleatório ("RAM") e armazenamento não volátil.

Outro hardware, convencional e/ou personalizado,também pode ser incluído. Similarmente, todos os comutadoresmostrados nas Figuras são somente conceituais. Suas funçõespodem ser realizadas por meio da operação de lógica de programa, por meio de lógica dedicada, por meio da interação decontrole de programa e lógica dedicada, ou mesmo manualmente, a técnica particular sendo selecionável pelo implementador da forma mais especificamente entendida pelo contexto.

Nas reivindicações deste, pretende-se que todo e1emento expressado como um dispositivo para realizar umafunção especificada abranja qualquer maneira de realizar aque la função incluindo, por exemplo, a) uma combinação deelementos de circuito que realiza aquela função ou b) suporte lógico em qualquer forma, incluindo, portanto, suportelógico embarcado, microcódigo ou semelhante, combinado comconjunto de circuito apropriado para executar aquele suportelógico para realizar a função. A invenção, da forma definidapor tais reivindicações, reside no fato de que as funciona-lidades providas pelos vários dispositivos citados são com-binadas e reunidas na maneira que as reivindicações exigem.Assim, percebe-se que qualquer dispositivo que possa proveraquelas funcionalidades é equivalente àqueles aqui mostra-dos.

Em relação à Figura 1, um aparelho de codificaçãode video exemplar é indicado, no geral, pelo número de refe-rência 199. O aparelho de codificação de video 199 inclui umcodificador de video 100 e um módulo de transformada de corde pré-codificação 105.

O módulo de transformada de cor de pré-codificação105 serve para realizar um pré-processamento de cor dos si-nais de video antes de dar entrada dos mesmos no codificadorde video 100. O pré-processamento de cor realizado pelo mó-dulo de transformada de cor de pré-codificação 105 é adicio-nalmente aqui descrito a seguir. Percebe-se que o módulo detransformada de cor de pré-codificação 105 pode ser omitidoem algumas modalidades.

Uma entrada do módulo de transformada de cor depré-codificação 105 e uma entrada do codificador de video100 estão disponíveis como entradas do aparelho de codifica-ção de video 199.

Uma saida do módulo de transformada de cor de pré-codificação 105 é conectada em comunicação de sinal com aentrada do codificador de video 100.A entrada do codificador de video 100 é conectadaem comunicação de sinal com uma entrada não invertida de umajunção de soma 110. A saida da junção de soma 110 é conecta-da em comunicação de sinal com um transformador / quantiza-dor 120. A saida do transformador / quantizador 120 é conec-tada em comunicação de sinal com o codificador de entropia140. Uma saida do codificador de entropia 140 está disponí-vel como uma saida do codificador de video 100 e também comouma saida do aparelho de codificação de video 199.

A saida do transformador / quantizador 120 é adicionalmente conectada em comunicação de sinal com um trans-formador / quantizador inverso 150. Uma saida do transforma-dor / quantizador inverso 150 é conectada em comunicação desinal com uma entrada de um filtro de remoção de registro dobloco 160. Uma saida do filtro de remoção de registro dobloco 160 é conectada em comunicação de sinal com os reposi-tórios de imagem de referência 170. Uma primeira saida dosrepositórios de imagem de referência 170 é conectada em co-municação de sinal com uma primeira entrada de um estimadorde predição de movimento e espacial 180. A entrada do codi-ficador de video 100 é adicionalmente conectada em comunica-ção de sinal com uma segunda entrada do estimador de predi-ção de movimento e espacial 180. A saida do estimador depredição de movimento e espacial 180 é conectada em comuni-cação de sinal com uma primeira entrada de um compensador depredição de movimento e espacial 190. Uma segunda saida dosrepositórios de imagem de referência 17 0 é conectada em co-municação de sinal com uma segunda entrada do compensador demovimento e espacial 190. A saída do compensador de movimen-to e espacial 190 é conectada em comunicação de sinal comuma entrada invertida da junção de soma 110.

Em relação à Figura 2, um aparelho de decodifica-ção de vídeo é indicado, no geral, pelo número de referência299. O aparelho de decodificação de vídeo 2 99 inclui um de-codificador de vídeo 200 e um módulo de transformada de corinversa de pós-decodificação 293.

Uma entrada do decodif icador de vídeo 200 estádisponível como uma entrada do aparelho de decodificação devídeo 299. A entrada do decodificador de vídeo 2 00 é conec-tada em comunicação de sinal com uma entrada do decodifica-dor de entropia 210. Uma primeira saída do decodificador deentropia 210 é conectada em comunicação de sinal com uma en-trada de um quantizador / transformador inverso 220. Uma sa-ída do quantizador / transformador inverso 220 é conectadaem comunicação de sinal com uma primeira entrada de uma jun-ção de soma 240.

A saída da junção de soma 240 é conectada em comu-nicação de sinal com um filtro de remoção de registro dobloco 290. Uma saída do filtro de remoção de registro dobloco 290 é conectada em comunicação de sinal com repositó-rios de imagem de referência 250. O repositório de imagem dereferência 250 é conectado em comunicação de sinal com umaprimeira entrada de um compensador de predição de movimentoe espacial 260. Uma saída do compensador de predição de mo-vimento e espacial 260 é conectada em comunicação de sinalcom uma segunda entrada da junção de soma 240. Uma segundasaída do decodificador de entropia 210 é conectada em comunicação de sinal com uma segunda entrada do compensador demovimento 260. A saída do filtro de remoção de registro dobloco 290 está disponível como uma saída do decodificador devídeo 200 e também como uma saída do aparelho de decodificação de vídeo 299.

Além do mais, uma saída do módulo de transformadade cor inversa de pós-decodificação 293 pode estar disponível como uma saída do aparelho de decodif icação de vídeo299. Em um caso como este, a saída do decodificador de vídeo200 pode ser conectada em comunicação de sinal com uma entrada do módulo de transformada de cor inversa de pósdecodif icação 293, que é um módulo de pós-processamento emrelação ao decodificador de vídeo 200. Uma saída do módulode transformada de cor inversa de pós-decodificação 293 prove um sinal transformado de cor inversa pós-processado emrelação à saída do decodificador de vídeo 200. Percebe-seque o uso do módulo de transformada de cor inversa de pósdecodif icação 293 é opcional.

É agora apresentada uma descrição para melhor codificação 4:4:4 de acordo com os princípios da presente invenção . Uma primeira modalidade descrita é uma modalidadecombinada na qual o algoritmo de codificação luma é usadopara todos os componentes de cor, o mesmo modo de prediçãoespacial é usado para todos os componentes de cor, e atransformada de cor residual (RCT) é omitida de dentro dolaço de compressão. Resultados de testes para esta modalidade combinada também são providos. Posteriormente, é descritauma segunda modalidade combinada em que o algoritmo de codi-ficação luma é usado para todos os componentes de cor, umconjunto (ou subconjunto) de preditores espaciais restritosé usado para todos os componentes de cor (em vez de um únicomodo de predição espacial), e a transformada de cor residual(RCT) é omitida de dentro do laço de compressão. Assim, umadiferença entre a primeira e a segunda modalidades combina-das é o uso de um único modo de predição espacial para todosos componentes de cor na primeira modalidade combinada emoposição ao uso de um conjunto (ou subconjunto) de predito-res espaciais restritos para todos os componentes de cor nasegunda modalidade combinada. Certamente, diante do exposto,as modalidades aqui descritas podem ser implementadas comomodalidades independentes ou podem ser combinadas de qual-quer maneira, da forma prontamente percebida pelos versadosna técnica. Por exemplo, de acordo com os princípios da pre-sente invenção da forma configurada em ma modalidade, somen-te um único modo de predição espacial é usado sem combinaçãocom outras modalidades, tal como a omissão da RCT do laço decompressão. Percebe-se que, dados os preceitos dos presentesprincípios aqui providos, estas e outras variações, imple-mentações e combinações das modalidades da presente invençãoficarão prontamente determináveis pelos versados na técnica,embora mantendo o escopo da presente invenção.

Em relação à Figura 3, um processo exemplar de codificação de video com um bloco de transformada de cor depré-codificação são indicados, no geral, pelos números dereferência 300 e 301, respectivamente.Percebe-se que o bloco de transformada de cor depré-codificação 301 inclui blocos 306, 308 e 310. Além domais, percebe-se que o bloco de transformada de cor de pré-codificação 301 é opcional e, assim, pode ser omitido em algumas modalidades da presente invenção.

O bloco de transformada de cor de pré-codificação301 inclui um bloco de limite de laço 306 que inicia um laçopara cada bloco em uma imagem e passa o controle para umbloco de função 308. O bloco de função 308 realiza pré-processamento de cor dos dados de sinal de video do bloco deimagem atual e passa o controle para um bloco de limite delaço 310. O bloco de limite de laço 310 termina o laço. Alémdo mais, o bloco de limite de laço 310 passa o controle paraum bloco de limite de laço 312, este último sendo incluidono processo de codificação de video 300.

O bloco de limite de laço 312 inicia um laço paracada bloco na imagem e passa o controle para um bloco defunção 315. O bloco de função 315 forma uma predição de movimento compensado ou espacial do atual bloco de imagem u-sando um preditor comum para cada componente do atual blocode imagem e passa o controle para o bloco de função 320. 0bloco de função 320 subtrai a predição de movimento compensado ou espacial do atual bloco de imagem para formar umapredição residual e passa o controle para um bloco de função330. O bloco de função 330 transforma e quantiza a prediçãoresidual e passa o controle para um bloco de função 335. Obloco de função 335 realiza a transformada inversa e quantiza a predição residual para formar uma predição residual co-difiçada e passa o controle para um bloco de função 345. 0bloco de função 345 adiciona o residual codificado na predição para formar um bloco de Figura codificado e passa o controle para um bloco de laço final 350. O bloco de laço final350 termina o laço e passa o controle para um bloco final355.

Em relação à Figura 4, um processo exemplar de decodificação de video com um bloco de transformada de cor inversa de pós-decodificação são indicados, no geral, pelosnúmeros de referência 400 e 460, respectivamente.

Percebe-se que o bloco de transformada de cor inversa de pós-decodificação 4 60 inclui blocos 462, 464, 466 e468. Além do mais, percebe-se que o bloco de transformada decor inversa de pós-decodificação 4 60 é opcional e, assim,pode ser omitido em algumas modalidades, da presente invenção.

O processo de decodificação 400 inclui um bloco delimite de laço 410 que inicia o laço para um bloco atual deuma imagem e passa o controle para um bloco de função 415. 0bloco de função 415 faz decodificação de entropia do residual codificado e passa o controle para um bloco de função420. O bloco de função 420 realiza a transformada inversa equantiza o residual decodificado para formar um residual codificado e passa o controle para um bloco de função 430. 0bloco de função 430 adiciona o residual codificado na predição formada a partir de um preditor comum para cada componente de cor para formar um bloco de Figura codificado epassa o controle para um bloco de limite de laço.435. O blo-co de limite de laço 4 35 termina o laço e passa o controlepara um bloco final 440.

Em algumas modalidades, o bloco de limite de laço435 opcionalmente passa o controle para o bloco de transfor-mada de cor inversa de pós-decodificação 460, em particular,o bloco de limite de laço 462 incluido no bloco de transfor-mada de cor inversa de pós-decodificação 460. O bloco de li-mite de laço 462 inicia um laço para cada bloco em uma ima-gem e passa o controle para um bloco de função 464. 0 blocode função 464 realiza um pós-processamento de cor inversodos dados de sinal de video do atual bloco de imagem e passao controle para um bloco de limite de laço 466. O bloco delimite de laço 466 termina o laço e passa o controle para umbloco final 468.

No formato 4:4:4 do H.264, cada canal de componen-te tem resolução completa. Assim, de acordo com a primeiramodalidade combinada apresentada anteriormente, o algoritmode codificação luma é usado em cada componente de cor paraalcançar a eficiência geral de compressão ideal. Dessa ma-neira, na modalidade, para intraquadros, cada componente decor pode ser comprimido, por exemplo, usando aqueles modosde predição listados na Tabela 8-2, Tabela 8-3 e Tabela 8-4em ISO/IEC 14496 10 Advanced Video Coding 3rd Edition (ITU-TRec. H.264), ISO/IEC JTC1/SC29/WG1 1 E ITU-T SG16 Q.6, Docu-mento N6540, julho de 2004.

Além do mais, na modalidade, o mesmo modo de pre-dição espacial é usado para todos os três componentes de pi-xel para reduzir adicionalmente a complexidade do codec emelhorar o desempenho. Por exemplo, o modo de predição ajus-tado pelos parâmetros prev_intra4x4_pred_mode_flag, remjn-tra4x4_pred_mode, prev_intra8x8_pred_mode_flag, erem_intra8x8_pred_mode para o luma no cabeçalho de pr ediçãodo macrobloco pode ser usado por todos os três componentes.Portanto, nenhum bit extra e elementos de sintaxe são neces-sários. Para os quadros (preditivos) B e P, os pixels de re-ferência em locais fracionários de pixel podem ser calcula-dos para todos os três canais. As mudanças detalhadas desintaxe e semântica ao padrão H.264 atual são adicionalmenteaqui discutidas a seguir.

A transformada de cor residual (RCT) foi adiciona-da ao codificador / decodificador no Alto Perfil 4:4:4. Emdecorrência disto, a estrutura de compressão para o formato4:4:4 é diferente daquela atualmente usada em todos os ou-tros perfis no padrão H.264 para formatos 4:2:0 e 4:2:2. Is-to resulta em alguma complexidade extra na implementação.Além do mais, similar a qualquer outra transformada de cor,YCOCG nem sempre melhora o desempenho geral de compressão. Aefetividade do YCOCG é altamente dependente do conteúdo. As-sim, para melhorar a compressão e robustez geral, na modali-dade, a transformada de cor é colocada fora do laço de pre-dição como uma parte do bloco de pré-processamento. Fazendoisto, selecionar uma transformada de cor ideal para uma ta-refa de compressão especifica é um problema operacional e amelhor resposta para uma seqüência de entrada particular po-de ser encontrada entre inúmeras opções. De acordo com umamodalidade em que todos os três componentes estão usando osmesmos preditores espaciais para os intraquadros e os mesmosfiltros de interpolação para os quadros B e P (preditivo eintercodificado), ter a transformada de cor realizada nosresíduos de predição é idêntico a realizar a transformada decor nas imagens fonte fora do codec quando os erros de arredondamento / truncagem são ignorados. Isto será aqui discutido adicionalmente a seguir. Assim, o bloco RCT é removidoda estrutura de codificação para tornar a estrutura de codificação consistente entre todos os formatos de cor.

Em relação à Figura 5, um modelo simplificado deRCT é indicado, no geral, pelo número de referência 500. Omodelo RCT 500 inclui um gerador de pixel de referência 510,uma junção de soma 520 e um módulo de transformação linear530. Entradas no gerador de pixel de referência 510 são configuradas para receber informação de movimento / borda e vetores [Xi] , [X2] ......... [Xn] . Uma saida do gerador de pixel de referência 510 é conectada em comunicação de sinalcom uma entrada invertida da junção de soma 520 que prove ovetor de predição [Xp] nele. Uma entrada não invertida dajunção de soma 520 é configurada para receber o vetor de entrada [Xp] . Uma saida da junção de soma 520 é configurada emcomunicação de sinal com uma entrada do módulo de transformação linear 530, que prove o vetor [Xd] nele. Uma saida domódulo de transformação linear 530 é configurada para provero vetor [Yd] .

No modelo simplificado da RCT 500, a transformadade cor representada por uma matriz 3x3 [A] (uma transformação linear) é definida como segue:<formula>formula see original document page 21</formula>

3x1 representando os pixels no domínio RGB. [Yd] é um vetor3x1 representando o resultado da transformada de cor. Por-tanto,

Posteriormente, na modalidade, os mesmos predito-res espaciais e filtros de interpolação são usados para to-dos os três componentes em um macrobloco de acordo com osprincípios da presente invenção da forma configurada em umamodalidade, o pixel de referência [Xp] podendo ser expressocomo segue:

<formula>formula see original document page 21</formula>

onde um vetor nxl [C] representa as operações li-neares envolvidas nos preditores espaciais e filtros de in-terpolação definidos no padrão H.264. Aqui, presume-se que opixel de referência seja calculado usando um número total den pixels vizinhos [Xi] , [X2] , ... [Xn]

Substituir [Xp] da equação (3) na equação (2) resulta no seguinte:

<formula>formula see original document page 22</formula> Ignorar os erros de arredondamento / truncagem eassumir que o mesmo modo de predição seja selecionado tantono dominio RGB quanto no dominio Y resulta no seguinte:

<formula>formula see original document page 22</formula>

Portanto,<formula>formula see original document page 23</formula>

Assim, a equação (6) mostra claramente que usarYUV como entrada para o codificador / decodificador, de a-cordo com os principios da presente invenção da forma confi-gurada nesta modalidade, é idêntico a realizar RCT.

Também, de acordo com os principios da presenteinvenção da forma configurada em uma modalidade, um inéditoperfil 4:4:4 é adicionado no padrão H.264, aqui referido co-mo "Advanced 4:4:4 Profile with profile_idc=166". Este iné-dito profile_idc pode ser adicionado no cabeçalho de parâme-tro de seqüência e pode ser usado no cabeçalho de camada demacrobloco, bem como no cabeçalho de dados residuais.

Para suportar o uso de algoritmo luma para codifi-car todos os três componentes de cor, algumas mudanças podemser feitas na sintaxe de dados residuais. Além do mais, tam-bém podem ser feitas mudanças na semântica de alguns dos e-lementos no cabeçalho do macrobloco, no cabeçalho de dadosresiduais, e assim por diante. No geral, a sintaxe existentepara luma na especificação H.2 64 permanecerá inalterada eserá usada para codificar um dos três componentes. As mudan-ças são compatíveis com versões anteriores. As mudanças de-talhadas de sintaxe e semântica são aqui descritas a seguir.

<formula>formula see original document page 23</formula>Agora será dada uma descrição em relação aos re-sultados da simulação realizada de acordo com os princípiosda presente invenção da forma configurada em várias modalidades .

Em relação às Figuras 6A e 6B, gráficos de PSNRmédio em função da taxa de bit para ATV somente intra sãoindicados, no geral, pelos números de referência 600 e 650,respectivamente.

Em relação às Figuras 7A e 7B, gráficos de PSNRmédio em função da taxa de bit para CT somente intra são in-dicados, no geral, pelos números de referência 7 00 e 750,respectivamente.

Em relação às Figuras 8A e 8B, gráficos de PSNRmédio em função da taxa de bit para DT somente intra são in-dicados , no geral, pelos números de referência 800 e 850.

Em relação às Figuras 9A e 9B, gráficos de PSNRmédio em função da taxa de bit para MIRJHD somente intra sãoindicados, no geral, pelos números de referência 900 e 950,respectivamente.

Em relação às Figuras 10A e 10B, gráficos de PSNRmédio em função da taxa de bit para RT somente intra são in-dicados, no geral, pelos números de referência 1000 e 1050,respectivamente.

Em relação às Figuras 11A e 11B, gráficos de PSNRmédio em função da taxa de bit para STBJHD somente intra sãoindicados, no geral, pelos números de referência 1100 e1150.

Em particular, as Figuras 6A, 7A, 8A, 9A, 10 e 11Ailustram resultados de teste para o perfil avançado 4:4:4proposto (indicado e precedido pelo termo "inédito") em função de resultados de aproximação correspondentes a ele. Alémdo mais, • as Figuras 6B, 7B, 8B, 9B, 10B e 11B ilustram resultados de teste para o perfil avançado 4:4:4 proposto (indicado e precedido pelo termo "inédito") em função deJPEK2k.

Em todas as Figuras 6A, 6B até 11A, 11B, o PSNR éindicado em decibéis (dB) e a taxa de bit é indicada em bitspor segundo (bps) . ATV, CT, DT, MIR, RT, STB são os nomesdos clipes de teste.

Todas as seqüências de teste JVT/FRExt descritasem JVT-J042, Seqüências de Teste Originadas de Filme, foramusadas nos testes. Todas elas são material de filme 4:4:4 de10 bits e cada clipe tem 58 quadros.

Os perfis avançados 4:4:4 propostos foram implementados no suporte lógico de referência JVT JM9.6. Tanto aestrutura de codificação somente intra quanto a estrutura decodificação IBBP foram usadas nos testes. O parâmetro dequantização foi ajustado em 6, 12, 18, 24, 30 e 42 para cadauma das curvas R-D. A seleção do modo otimizado em RD foiusada.

O perfil avançado 4:4:4 proposto também foi comparado com os resultados que foram conseguidos executando osuporte lógico de referência com o TUVFormat=0(4:0:0) em cada componente de entrada individual. Três contagens de bitcomprimido individual separado foram simplesmente somadaspara obter o total de bits comprimidos para calcular a taxade bit comprimido.

Em relação a JPEG2k, o suporte lógico KaKaduV2.2.3 foi usado nos testes. Os resultados do teste foramgerados usando 5 niveis de descompressão de ondeletas com ofiltro de ondeletas biortogonal de 9/7 derivações. Havia somente um ladrilho por quadro e a Otimização em RD para umadada taxa alvo também foi usada.

Todas as medidas PSNR foram feitas no domínio RGB.PSNR médio, definido como(PSNR(red)+PSNR(green)+PSNR(blue))/3, é usado para comparara qualidade geral de compressão. Isto ocorre, principalmente, em virtude de os dados comprimidos em JPEG2k serem computados usando um algoritmo de controle de taxa desconhecidoprovido pelo suporte lógico. Para alguns casos, os valoresRGB PSNR são completamente distantes um do outro, especialmente quando a transformada de cor JPEG2k foi usada.

A comparação de compressão foi realizada como segue :

* Newl: o perfil avançado 4:4:4 proposto com um único modo de predição.

* New3: o perfil avançado 4:4:4 proposto com trêsmodos de predição.

* RCT-OFF: entrada RGB com RCT=off.

* RCT-ON: entrada RGB com RCT=on.

* YCOCG: conversão RGB para YCOCG foi feita forado codec. Então, o YCOCG convertido foi usado como a entradapara o suporte lógico JVT.

* R+G+B: Método proposto aproximado comprimindo ossinais R, G e B separadamente.

* Y+CO+CG: Método proposto aproximado comprimindoos sinais convertidos Y, CO, CG separadamente.

*J2k_RGB: A compressão JPEG2k foi feita no dominioRGB. A transformada de cor JPEG2k foi desligada.

*J2k_YUV: A compressão JPEG2k foi feita no dominioYUV. A transformada de cor JPEG2k foi usada.

De acordo com os resultados do teste, uma imple-mentação de acordo com os princípios da presente invenção daforma configurada em uma modalidade, no geral, é muito simi-lar ao JPEG2k em termos de eficiência geral de compressão.Em alguns casos, ela é ainda ligeiramente melhor.

Adicionalmente, uma implementação de acordo com osprincípios da presente invenção da forma configurada em umamodalidade prove desempenho (compressão) significativamentemelhor que o atual Alto Perfil 4:4:4 para qualidade acima de40 dB (PSNR). Especificamente, Newl-YCOCG ou New3-YCOCG émelhor que YCOCG e RCT-ON; Newl-RGB ou New3-RGB é melhor queRCT-OFF. Em um PSNR igual ou maior que 45 dB (PSNR), a me-lhoria média no PSNR médio é maior que 1,5 dB. No último e-xemplo, a melhoria pode ser traduzida em mais de 25% de eco-nomia de bit em um PSNR igual a 45 dB.

De acordo com os resultados do teste, parece queas transformações de cor ajudam no desempenho de codificaçãoquando o conteúdo é mais saturado de cor, tais como TP, RT.Isto é, se a cor for neutra e menos saturada, codificar odominio RGB pode ser a escolha certa. A observação exposta éindependente de qual transformada de cor é usada.Comparando os resultados de Newl-YCOCG ou New3-YCOCG e JPEG-2k_YUV, observou-se que o desempenho de uma transformada de cor especifica em termos de melhorar a eficiência de codificação é muito dependente do conteúdo. Nem sempre a transformada de cor única é melhor. Portanto, nossos dados confirmaram que ter uma transformada de cor, tal como RCT, dentro de um laço de codificação (ou decodifica-ção) pode não ser uma boa idéia. Em vez disto, realizar a transformada de cor, se for necessária, fora do codificador / decodificador pode fazer com que todo o sistema de compressão proveja um desempenho melhor e mais robusto.

Comparando YCOCG com RCT-ON, os resultados do teste não mostram nenhuma melhoria na eficiência de codificação em relação a RCT. Além do mais, percebe-se que executar o suporte lógico de referência com a RCT ligada aumentou significativamente o tempo de codificação. 0 tempo de execução foi mais de 2,5 vezes maior.

Agora, será dada uma descrição em relação a mudanças de sintaxe e semântica de acordo com os princípios da presente invenção da forma configurada em uma modalidade.

Em relação à Figura 12, uma tabela para sintaxe de parâmetro de seqüência H.264 é indicada, no geral, pelo número de referência 1200. Mudanças na sintaxe de acordo com os princípios da presente invenção da forma configurada em uma modalidade são indicadas por texto em itálico.

Em relação à Figura 13, uma tabela para sintaxe de dados residuais H.264 é indicada, no geral, pelo número de referência 1300. Adições / mudanças na sintaxe de acordo comos princípios da presente invenção da forma configurada emuma modalidade são indicadas por texto em itálico. Na tabela1300, a seção luma no cabeçalho de dados residuais junto comalgumas modificações de texto necessárias são repetidas duasvezes para suportar o lumal e luma2, respectivamente -

Conforme exposto, a supradescrita primeira modali-dade combinada foi avaliada e testada implementando os pre-sentes princípios no suporte lógico de referência JVT JM9.6.Os resultados de teste marcados com Newl-RGB ou Newl-YCOCGrepresentam a primeira modalidade combinada.

Conforme exposto, de acordo com os princípios dapresente invenção da forma configurada em uma modalidade, umconj unto (ou subconjunto) de três (3) preditores espaciaisrestritos é utilizado para os canais componentes (por exem-plo, formatos RGB, YUV, YCrCb, e assim por diante) em vez deum único modo de predição espacial. Além do mais, conformeexposto, esta modalidade pode ser combinada com outras moda-lidades aqui descritas, tais como, por exemplo, o uso de so-mente o algoritmo de codificação luma para codificar todosos três canais componentes de conteúdo e/ou o uso de trans-formada de cor como uma etapa de pré-processamento.

Agora, será dada uma descrição em relação à supra-descrita segunda modalidade combinada envolvendo o uso de umconjunto (ou subconjunto) de três (3) preditores espaciaisrestritos para os componentes de cor, o uso de somente o al-goritmo de codificação luma para codificar todos os trêscomponentes de cor e o uso de transformada de cor como umaetapa de pré-processamento (isto é, sem RCT no laço de com-pressão). Algumas variações desta modalidade também serãodescritas com isto.

Em relação à Figura 14, um processo exemplar decodificação de video com uma etapa de transformada de cor depré-codificação são indicados, no geral, pelos números dereferência 1400 e 1401, respectivamente.

Percebe-se que o bloco de transformada de cor depré-codificação 1401 inclui blocos 1406, 1408 e 1410. Alémdo mais, percebe-se que o bloco de transformada de cor depré-codificação 14 01 é opcional e, assim, pode ser omitidoem algumas modalidades da presente invenção.

\ O bloco de transformada de cor de pré-codificação14 01 inclui um bloco de limite de laço 14 06 que inicia umlaço para cada bloco em uma imagem e passa o controle paraum bloco de função 1408. O bloco de função 1408 desempenha opré-processamento de cor dos dados de sinal de video do atual bloco de imagem e passa o controle para um bloco de limite de laço 1410. O bloco de limite de laço 1410 termina olaço. Além do mais, o bloco de limite de laço 1410 passa ocontrole para um bloco de limite de laço 1412, este últimosendo incluído no processo de codificação de video 14 00.

O bloco de limite de laço 1412 inicia um laço paracada bloco na imagem e passa o controle para um bloco defunção 1415. O bloco de função 1415 forma uma predição de movimento compensada ou espacial do atual bloco de imagemusando um preditor comum para cada componente de cor do atual bloco de imagem e passa o controle para um bloco de função 1420. O bloco de função 1420 subtrai a predição de movi-mento compensada ou espacial da atual bloco de imagem paraformar uma predição residual e passa o controle para um blo-co de função 1430. O bloco de função 1430 transforma e quan-tiza a predição residual e passa o controle para um bloco defunção 1435. O bloco de função 1435 realiza a transformadainversa e quantiza a predição residual para formar uma pre-dição residual codificada e passa o controle para um blocode função 1445. O bloco de função 1445 adiciona o residualcodificado na predição para formar um bloco de Figura e pas-sa o controle para um bloco de laço final 1450. O bloco delaço final 1450 termina o laço e passa o controle para umbloco final 1455.

Em relação à Figura 15, um processo exemplar dedecodificação de video com uma etapa de transformada de corinversa de pós-decodificação são indicados, no geral, pelosnúmeros de referência 1500 e 1560, respectivamente.

Percebe-se que o bloco de transformada de cor in-versa de pós-decodificação 1560 inclui blocos 1562, 1564,1566 e 1568. Além do mais, percebe-se que o bloco de trans-formada de cor inversa de pós-decodificação 1560 é opcionale, assim, pode ser omitido em algumas modalidades da presen-te invenção.

0 processo de decodificação 1500 inclui um blocode limite de laço 1510 que inicia o laço para um bloco atualde uma imagem e passa o controle para um bloco de função1515. O bloco de função 1515 faz decodificação de entropiado residual codificado e passa o controle para um bloco defunção 1520. O bloco de função 1520 realiza a transformadainversa e quantiza o residual decodificado para formar umresidual codificado e passa o controle para um bloco de função 1530. O bloco de função 1530 adiciona o residual codificado na predição formada a partir de um preditor comum paracada componente de cor para formar um bloco de Figura codificado e passa o controle para um bloco de limite de laço1535. O bloco de limite de laço 1535 termina o laço e passao controle para um bloco final 1540.

Em algumas modalidades, o bloco de limite de laço1535 opcionalmente passa o controle para o bloco de transformada de cor inversa de pós-decodificação 1560, em particular, o bloco de limite de laço 1562 incluido no bloco detransformada de cor inversa de pós-decodificação 1560. Obloco de limite de laço 1562 inicia um laço para cada blocoem uma imagem e passa o controle para um bloco de função1564. O bloco de função 1564 realiza um pós-processamento decor inversa dos dados de sinal de video do atual bloco deimagem e passa o controle para um bloco de limite de laço1566. O bloco de limite de laço 1566 termina o laço e passao controle para um bloco final 1568.

Conforme exposto, é divulgado um perfil inédito(profile_idc=166) para o perfil avançado 4:4:4 . Este perfilinédito também pode ser usado para a segunda modalidade combinada com mudanças de semântica e sintaxe correspondentesda forma aqui descrita a seguir para a segunda modalidadecombinada. Este inédito profile_idc é adicionado no Conj untode Parâmetro de Seqüência e será usado, principalmente, noscabeçalhos subseqüentes para indicar que o formato de entra-da é 4:4:4 e todos os três canais de entrada são codificadosde forma similar a luma.

Para minimizar as mudanças necessárias ao padrãoH.264, nenhum tipo inédito de macrobloco é divulgado para oPerfil avançado 4:4:4. Em vez disto, todos os tipos de ma-crobloco juntos com os parâmetros de codificação associadoslistados na Tabela 7-11, Tabela 7-13 e Tabela 7-14 do padrãoH.264 ainda são válidos. Para o caso de intramacroblocos,todos os três canais de entrada, lüma, Cr e Cb serão codifi-cados com base no MbPartPredMode definido na Tabela 7-11 dopadrão H.264. Por exemplo, um macrobloco Intra_4x4 no perfilavançado 4:4:4 significa que todos os canais componentes deentrada podem ser codificados usando todos os 9 possíveismodos de predição dados na Tabela 8-2 do padrão H.264. Parareferência, na atual Alto Padrão 4:4:4, dois dos canais paraum macrobloco Intra_4x4 serão tratados como crorna e somenteum dos 4 possíveis modos de intrapredição na Tabela 8-5 dopadrão H.264 será usado. Para os macroblocos B e P, as mu-danças feitas no padrão avançado 4:4:4 ocorrem no processode interpolação para o cálculo do valor de pixel de referên-cia no local fracionário de pixel. Aqui, o procedimento des-crito na Seção 8.4.2.2.1 do padrão H.264, processo de inter-polação de amostra luma, será aplicado para luma, Cr e Cb.Novamente para referência, o atual Alto Padrão 4:4:4 usa aSeção 8.4.2.2.2 do padrão H.264, processo de interpolação deamostra crorna, para dois dos canais de entrada.

No caso em que o CABAC é escolhido como o modo decodificação de entropia, dois conjuntos separados de modelosde contexto idênticos àqueles atualmente definidos para lumaserão criados para Cr e Cb. Eles também serão atualizadosindependentemente durante o curso da codificação.

Finalmente, na modalidade, uma vez que não há bloco RCT no laço de codificação, a ResidueColorTransformFlag éremovida do conjunto de parâmetro de seqüência no perfil avançado 4:4:4.

Até este ponto, a maioria das mudanças de sintaxeocorre nos dados residuais da forma mostrada na Figura 13,onde a sintaxe original para luma é repetida duas vezes parasuportar Cr e Cb nos perfis avançados 4:4:4 propostos.

Em relação à tabela de camada de macrobloco H.264(não mostrada), mudanças de semântica na sintaxe correspondente incluem o seguinte.

coded_block_pattern (Add). Quando croma_format_idcfor igual a 3 e coded_block_pattern estiver presente, Coded-BlockPatternCroma deve ser a j ustado em 0. Além do mais, Co-dedBlockPatternLuma especifica, para cada um dos doze blocos8x8 luma, Cb e Cr do macrobloco, um dos seguintes casos: (1)Todos os niveis de coeficiente da transformada dos doze blo-cos luma 4x4 nos blocos luma 8x8, Cb 8x8 e Cr 8x8 são iguaisa zero; (2) Um ou mais niveis de coeficiente da transformadade um ou mais dos blocos luma 4x4 nos blocos luma 8x8, Cb8x8 e Cr 8x8 devem receber valor não zero.

Agora, será dada uma descrição em relação à seleção do modo de predição espacial para os intrablocos de a-cordo com a segunda modalidade combinada (ou a única modali-dade relacionada ao uso do conjunto (ou subconjunto) de trêspreditores espaciais restritos).

Para cada componente escolher seu melhor MbPart-PredMode e o subseqüente melhor modo de predição espacialindependentemente, como no caso enquanto está codificandocada canal de entrada separadamente, alguns tipos inéditosde intrablocos podem ser adicionados na Tabela 7-11 do pa-drão H.264. Em decorrência disto, será feita uma grandequantidade de mudanças no padrão H.264. Em uma modalidaderelacionada à segunda modalidade combinada, o mbjypes atualpermanece inalterado e é provida uma solução alternativa. Namodalidade, os três canais de entrada são restritos para sercodificados com o mesmo MbPartPredMode ou tipo de macrobloco. Então, uma pequena quantidade de elementos inéditos éadicionada na Sintaxe de Predição do Macrobloco para suportar três modos de predição separados. Portanto, cada componente ainda pode, teoricamente, escolher seu melhor modo depredição espacial independentemente a fim de minimizar o erro de predição para cada canal componente. Por exemplo, as-sumindo que um macrobloco Intra_4x4 sej a escolhido como ombj ype, luma, Cr ou Cb ainda podem encontrar seus própriosmelhores modos de predição espacial na Tabela 8-2 na Seção8.3.1.1 do padrão H.264, tal como, por exemplo, Intra_4x4_Vertical para luma, Intra_4_4_Horizontal para Cr eIntra_4x4_Diagonal_Down_Left para Cb.

Uma outra abordagem, em relação à primeira modalidade combinada supradescrita, é compelir todos os três ca-nais de entrada a compartilhar o mesmo modo de predição. Isto pode ser feito usando a informação de predição que é a tu-almente suportado pelos elementos de sintaxe existentes,tais como prev_intra4x4_pre_mode_flag,rem_intra4x4_pred_mode, pre_intra8x8_pred_mode_flag erem_intra8x8_pred_mode/ na sintaxe de Predição do Macroblo-co. Esta opção irá resultar em menos mudanças no padrãoH.264 e, também, em alguma ligeira perda de eficiência decodificação.

Com base nos resultados de testes, usar três modosde predição pode melhorar o desempenho geral de codificaçãoem cerca de 0,2 dB em relação à primeira modalidade combinada .

Em relação à Figura 16, uma tabela para a sintaxede predição do macrobloco H.264 é indicada, no geral, pelonúmero de referência 17 00. Para referência, a Sintaxe dePredição de Macrobloco modificada para suportar o uso detrês modos de predição é listada a seguir, onde:

prev_intra4x4_pred_mode_flagO erem_intra4x4_pred_mode0 são para luma;

prev_intra4x4_pred_mode_flagl erem_intra4x4_pred_model são para Cr;

prev_intra4x4_pred_mode_flag2 erem_intra4x4_pred_mode2 são para Cb.

Agora, será dada uma descrição em relação aos resultados da simulação realizada de acordo com os princípiosda presente invenção da forma configurada em uma modalidade,para a segunda modalidade combinada.

Todas as seqüências de teste JVT/FRExt são descritas em JVT-J042, Seqüências de Teste Originadas de Filme,JVT-J039 (Viper) . Todas elas são materiais 4:4:4 de 10 bitse cada clipe tem 58 quadros.

0 algoritmo proposto foi implementado no suportelógico de referência JVT JM9.6 e o suporte lógico modificadofoi usado nos testes. Tanto somente intra quanto IBRrBP foram testados. Aqui, "Br" significa as Figuras B gravadas. Ocaso somente intra foi feito para todas as seqüências com oparâmetro de quantização igual a 6, 12, 18, 24, 30, 36 e 42.Em função da grande quantidade de tempo envolvido na simulação, a estrutura IBRrBP GOP somente foi feita para os clipesde filme com um parâmetro de quantização igual a 12, 18, 24,30 e 36. De acordo com a discussão no AHG 4:4:4, os seguintes parâmetros chave foram usados nos testes:

SymbolMode = 1RDOptimization = 1ScalingMatrixPresentFlag = 0OffsetMatrixPresentFlag = 1QoffsetMatrixFile = "q_offset.cfg"AdaptiveRounding = 1AdaptRnd Period = 1AdaptRndCroma = 1AdaptRndWFactorX = 8SearchRange = 64UseFME = 1

Em relação a JPEG2k, o suporte lógico KaKaduV2.2.3 foi usado nos testes. Os resultados do teste foramgerados usando 5 niveis de descompressão de ondeletas com ofiltro de ondeletas biortogonal de 9/7 derivações. Havia so-mente um ladrilho por quadro e a Otimização em RD para umadada taxa alvo também foi usada.

As medições PSNR foram calculadas primariamente nodominio de cor original dos conteúdos fonte, que é RGB paraos clipes supradescritos. PSNR médio, definido como(PSNR(red)+PSNR(green)+ PSNR(blue))/3, é usado para comparara qualidade geral de compressão.

A comparação de compressão foi realizada como se-gue :

Newl: o Perfil avançado 4:4:4 proposto com um único modo de predição.

New3: o Perfil avançado 4:4:4 proposto com trêsmodos de predição.

RCT-OFF: entrada RGB com RCT=off.

RCT-ON: entrada RGB com RCT=on.

YCOCG: conversão RGB para YCOCG foi feita fora docodec. Então, o YCOCG convertido foi usado como a entradapara o suporte lógico JVT.

R+G+B: Método proposto aproximado comprimindo ossinais R, G e B separadamente.

Y+CO+CG: Método proposto aproximado comprimindo ossinais Y, CO e CG convertidos separadamente.

JPEG2K_RGB: A compressão JPEG2k foi feita no domi-nio RGB. A transformada de cor JPEG2k foi desligada.

JPEG2k_YUV: A compressão JPEG2k foi feita no domi-nio YUV. A transformada de cor JPEG2k foi usada.

Para o caso somente intra, o perfil avançado 4:4:4proposto de acordo com os presentes princípios é muito simi-lar ao JPEK2k em termos de eficiência geral de compressão. Em alguns casos, ele é mesmo ligeiramente melhor.

A abordagem de acordo com os princípios da presente invenção é claramente melhor que o atual Alto Perfil 4:4:4. Em um PSNR igual e maior que 45 dB (PSNR), a melhoria média no PSNR médio é maior que 1,5 dB. Em alguns casos, a melhoria pode ser traduzida em mais de 25% de economia de bit em um PSNR igual a 45 dB.

Agora, será dada uma descrição de alguns dos muitos recursos / vantagens presentes providos pelos princípios das modalidades da presente invenção.

Os resultados do teste demonstram que o perfil a-vançado 4:4:4 proposto utilizando as melhorias correspondentes aos princípios da presente invenção proporciona melhor desempenho comparado com o atual Alto Perfil 4:4:4. 0 ganho de desempenho é significativo. Além do mais, mover a transformada de cor para fora do codec tornará a arquitetura do codec consistente entre todos os formatos de cor. Em decorrência disto, isto torna a implementação mais fácil e reduz o custo. Isto também torna o codec mais robusto em termos de selecionar a transformada de cor ideal para alcançar melhor eficiência de codificação. Também, a abordagem proposta não adiciona nenhuma ferramenta de codificação inédita e exige somente algumas ligeiras mudanças na sintaxe e na semântica.

Assim, de acordo com os princípios da presente invenção da forma configurada em uma modalidade, um método e aparelho são providos para codificação e decodificação de video. São providas modificações no padrão H.264 existenteque melhoram o desempenho além daquele atualmente alcançável. Além do mais, o desempenho é melhorado ainda além do JPEG-2000 para aplicações de alta qualidade. De acordo com os princípios da presente invenção da forma configurada ein uma modalidade, melhorias significativas de desempenho de codificação 4:4:4 no padrão H.264 podem ser alcançadas usando o algoritmo de codificação luma para codificar todos os três componentes de cor do conteúdo 4:4:4. Isto é, nenhuma ferramenta inédita é necessária para o algoritmo de codificação luma (ou croma, que não é usado). Em vez disto, ferramentas de codificação luma existentes são utilizadas. Adicionalmente, mudanças de sintaxe e de semântica ao atual perfil 4:4:4 podem ser implementadas de acordo com os presentes princípios para suportar a codificação luma de todos os três canais componentes. Em testes conduzidos de acordo com uma modalidade da presente invenção, quando o conteúdo fonte tem muitas texturas e bordas espaciais, as ferramentas de predição espacial usadas em luma, exibiram claramente seu desempenho superior àquelas usadas em croma. Para algumas das seqüências de teste, quando cada componente de cor foi codificada como luma, foi observada mais de 30% de redução de bit em uma qualidade de compressão maior ou igual a 45 dB (PSNR médio).

Percebe-se que, embora a presente invenção tenha sido aqui descrita essencialmente em relação aos dados de sinal de video amostrados usando o formato 4:4:4 do padrão H.2 64, a presente invenção também pode ser prontamente implementada em relação aos dados de sinal de video amostradosusando outros formatos (por exemplo, o formato 4:2:0 e/ou o formato 4:2:2) do padrão H.2 64, bem como outros padrões de compressão de vídeo. Dados os preceitos da presente invenção aqui providos, estas e outras variações da presente invenção também podem ser prontamente implementadas pelos versados na técnica, embora mantendo o escopo da presente invenção.

Estes e outros recursos e vantagens da presente invenção podem ser prontamente determinados pelos versados na técnica com base nos preceitos aqui divulgados. Entende-se que os preceitos da presente invenção podem ser implementados em várias formas de hardware, suporte lógico, suporte lógico embarcado, processadores com propósito especial ou suas combinações.

Mais preferivelmente, os preceitos da presente invenção são implementados como uma combinação de hardware e suporte lógico. Além do mais, o suporte lógico pode ser implementado como um programa de aplicação embutido de forma tangível em uma unidade de armazenamento de programa. O programa de aplicação pode ser carregado em uma máquina compreendendo qualquer arquitetura adequada e executado por ela. Preferivelmente, a máquina é implementada em uma plataforma de computador com hardware tais como uma ou mais unidades centrais de processamento ("CPU"), uma memória de acesso a-leatório ("RAM") e interfaces de entrada / saída ("I/O"). A plataforma de computador também pode incluir um sistema operacional e código de microinstrução• Os vários processos e funções aqui descritos podem ser tanto parte do código de microinstrução quanto parte do programa de aplicação, ouqualquer combinação destes, que podem ser executadas por uma CPU. Além do mais, várias outras unidades periféricas podem ser conectadas na plataforma do computador, tais como uma unidade de armazenamento de dados adicional e uma unidade de impressão.

Entende-se adicionalmente que, em virtude de alguns dos componentes e métodos constituintes do sistema representado nos desenhos anexos ser, preferivelmente, implementados em suporte lógico, as conexões reais entre os componentes do sistema ou os blocos de função do processo podem diferir dependendo da maneira na qual a presente invenção é programada. Dados os preceitos aqui divulgados, versados na técnica serão capazes de contemplar estas e similares implementações ou configurações da presente invenção.

Embora as modalidades ilustrativas tenham sido a-qui descritas em relação aos desenhos anexos, entende-se que a presente invenção não está limitada a estas precisas modalidades e que várias mudanças e modificações podem ser nelas realizadas pelos versados na técnica sem fugir do escopo e do espírito da presente invenção. Pretende-se que todas tais mudanças e modificações estejam incluídas no escopo da presente invenção da forma apresentada nas reivindicações ane-

Claims

1. Aparelho para decodificar dados de sinal de vi-deo para um bloco de imagem, CARACTERIZADO pelo fato de que o aparelho compreende um decodificador (200) para decodificar componentes de cor dos dados de sinal de video sem aplicar uma transformada de cor residual neles.

2. Aparelho, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que compreende adicionalmente um módulo de transformada de cor inversa de pós-decodificação (293) em comunicação de sinal com o dito decodif icador para realizar seletivamente uma transformada de cor inversa nos componentes de cor dos dados de sinal de video antes da decodif icação dos componentes de cor pelo dito decodificador.

3. Aparelho, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que a transformada de cor inversarealizada pelo dito módulo de transformada de cor inversa de pós-decodificação (293) é uma transformada de cor não residual -

4. Aparelho, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o dito módulo de transformadade cor inversa de pós-decodificação (293) realiza a transformada de cor inversa em imagens de origem correspondentes aos dados de sinal de video.

5. Aparelho, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o dito módulo de transformadade cor inversa de pós-decodificação (293) prove componentes de cor transformados dos dados de sinal de video no formato RGB ou qualquer formato não RGB.

6. Aparelho, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito decodificador (200) decodifica todos os componentes de cor dos dados de sinal de video usando um preditor comum.

7. Aparelho, de acordo com a reivindicação 6,CARACTERIZADO pelo fato de que o preditor comum é um preditor luma usado tanto para componentes luma quanto para componentes croma dos dados de sinal de video.

8. Aparelho, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o dito decodif icador (200) usa um modo de predição espacial comum para todos os componentes de cor dos dados de sinal de video.