KR101571573B1

KR101571573B1 - 부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩

Info

Publication number: KR101571573B1
Application number: KR1020107009175A
Authority: KR
Inventors: 알렉산드로스 토우라피스; 아타나시오스 레온타리스; 케빈 제이. 스텍
Original assignee: 돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date: 2007-09-28
Filing date: 2008-08-08
Publication date: 2015-11-24
Also published as: EP2204044B1; JP5306358B2; WO2009045636A2; CN101810007B; US20120281751A1; KR20100080916A; WO2009045636A3; EP2204044A2; US8229159B2; US20090087110A1; CN101810007A; JP2010541383A; US8571256B2

Abstract

신호 추가 정보(Signal Supplemental Information), 예를 들어, 메타데이타,에 구체적인 예측 모드(Prediction Mode)를 사용하는 멀티미디어 코딩 및 디코딩 시스템과 방법이 나타나있고 다른 한편으로는 코딩 수행과 메타데이타 역량 사이의 트레이드 오프를 제공하고 고려한다. 상기 예측 모드는 모드를 비트에 연관시키는 한 모드 테이블에 따르고 코딩 영향(Coding Impact)을 고려함으로써 인코딩 될 수 있다. 시작 및 종료 코드는 메시지를 보내는 데 사용될 수 있고, 다른 한편으로는 어떻게 올바르게 모드를 비트 테이블에 설계하는지에 관한 여러 가지 기술이 제시되어 있다.

Description

부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩{MULTIMEDIA CODING AND DECODING WITH ADDITIONAL INFORMATION CAPABILITY}

연관된 명세서에 대한 상호 참조

이 명세서는 "부가적인 정보 역량(Capability)을 이용한 멀티미디어 코딩 및 디코딩", 명세서 번호. 60/976,185로 2007년 7월 28일에 출원된 미 연방 명세서(U.S. Provisional Application)의 우선권의 이익을 주장하고, 이것의 공개는 참조에 의해 포함된다.

비디오 신호를 따라 2차적 정보를 전송하기 위한 기술이다.

멀티미디어 신호 인코딩 및 디코딩, 예를 들어 비디오 및/또는 음향, 은 채널로 보내지기 위한 정보의 양을 줄이기 위한 극도의 압축에 의존할 수 있다. 인코더는 신호를 가장 효과적으로 인코딩하는 압축 파라메터를 선택하기 위해 종합적인 최적화 방법을 종종 수행한다.

멀티미디어 신호 인코딩 및 디코딩, 예를 들어 비디오 및/또는 음향의, 은 채널로 보내지기 위한 정보의 양을 줄이기 위한 극도의 압축에 의존할 수 있다.

본 명세서는 비디오 신호를 따라 2차적 정보를 전송하기 위한 기술을 설명하고, 2차적 정보는 구체적인 인코딩에서 사용된 제약에 의해 인코딩될 수 있다.

본 실시형태는 예측 타입(Prediction Type)이 됨으로서 제약을 가질 수 있다. 본 실시형태는 시작 및 종료 코드를 또한 포함할 수 있다. 어떠한 실시형태는 전송 계층(Transport Layer)에 독립적인 비디오 비트 스트림 안에 다양한 2차적 정보가 내포되는 것을 포함할 수 있다. 2차적 정보는 인코더에 의해 인코딩되어 이후에 디코딩되는 일련의 비트이다. 코딩은 레가시(Legacy) 시스템에 완전히 명료하다. 여기에서 어떠한 실시형태는 어떻게 차선의 인코딩 결정과 같은 코딩 결정이 차후의 인코딩 결정에 의해 적어도 부분적으로 보상되는지를 보여줄 수 있다. 레가시 시스템이 2차적 정보에 지원을 제공하는지에 상관없이 여기에서 어떠한 실시형태는 레가시 시스템에서 사용될 수 있다.

이러한 그리고 다른 측면들이 첨부된 도면에 관련하여 이제 상세하게 설명될 것이다.
도 1은 AVC 비디오 코딩 표준에서 여러 매크로 블록 및 서브 매크로 블록 파티션의 실시예를 나타내고;
도 2는 AVC 표준에서 여러 가지 내부(Intra) 4x4 예측 모드의 실시예를 나타내고;
도 3은 AVC 표준에서 여러 가지 내부 16x16 예측 모드의 실시예를 나타내고;
도 4 및 5는 각각 AVC 내의 내부 예측 블록 및 4x4 블록 스캐닝의 실시예를 나타내고;
도 6은 코딩 및 디코딩 시퀀스의 실시예를 나타내는 블록도를 나타내고;
도 7은 시작 코드/종료 코드 및 시그널링의 실시예를 나타내고;
도 8은 예시적 비디오 인코더의 블록도를 나타내고;
도 9는 예시적 비디오 디코더의 블록도를 나타내고;
도 10은 메시지 로케이터(Locator) 실시예의 일 예를 나타내고; 및
도 11은 비디오 코딩 내의 마킹의 실시예를 나타낸다.

예시적인 실시형태는 여기에서 설명된다. 이하의 설명에서, 설명의 목적을 위해, 여러 가지 구체적인 상세한 사항들이 본 발명의 철저한 이해를 제공하기 위해 제시된다. 하지만 본 발명의 실시형태가 이러한 구체적인 상세한 사항이 없이도 실현될 수 있다는 것이 명백하다. 다른 예들에서, 잘-알려진 구조와 장치들이 불필요하게 본 발명을 모호하게 하는 것을 피하기 위해서 블록도의 형태로 나타난다.

개요

어떠한 측면에서, 어떠한 실시형태는 이산-시간 미디어 신호를 인코딩하는 방법을 특징으로 한다. 상기 방법은 미디어 신호를 수신하는 단계, 상기 미디어 신호내에서 인코딩 될 추가 정보를 획득하는 단계, 복수의 여러 인코딩 타입으로부터 하나의 인코딩 타입을 선택하기 위해 상기 추가 정보를 사용하는 단계를 포함한다. 상기 인코딩 타입은 상기 추가 정보를 표현한다.

이들 및 다른 실시형태들은 아래의 특징 중 하나 이상을 선택적으로 포함할 수 있다. 상기 미디어 신호는 비디오 신호일 수 있다. 상기 인코딩 타입은 상기 비디오 신호를 위한 복수의 예측 모드들 중 적어도 하나를 포함할 수 있다. 상기 방법은 상기 예측 모드들을 코딩 성능에의 영향을 감소시키기 위해 선택되는 시그널링 그룹들로 함께 그룹화하는 단계를 더 포함할 수 있다. 상기 방법은 시작 코드 및/또는 종료 코드 및/또는 길이 코드 중 적어도 하나를 정의하는 단계, 및 상기 추가 정보에 인접한 비디오 신호 위치 내의 상기 시작 코드 및/또는 종료 코드 및/또는 및/또는 길이 코드 중 적어도 하나를 정의하는 단계, 및 상기 인코딩 타입을 사용하여 상기 추가 정보에 인접한 비디오 신호 위치 내의 상기 시작 코드, 종료 코드, 또는 길이 코드 중 적어도 하나를 나타내는 단계를 더 포함할 수 있다. 상기 시작 코드 및/또는 종료 코드가 실제 비디오에서 일어나기 어려운 인코딩 결정 시퀀스를 나타낼 수 있다. 상기 추가 정보는 비디오 신호의 내용과 연관되고, 비디오 신호의 여러 부분과 시간적으로 동기화될 수 있다. 상기 추가 정보는 상기 비디오 신호에 연관되지 않을 수 있다.

상기 방법은 대략 유사한 성능을 가진 코딩 타입들을 결정하는 단계, 및 상기 사용하는 단계가 코딩 성능에 끼칠 영향을 감소시키는 그룹을 형성하기 위해 상기 코딩 방법들을 그룹화하는 단계를 포함할 수 있다. 방법은 2차적 정보에 기초하여 선택된 제1 인코딩 타입을 검출하는 단계를 포함할 수 있다. 방법은 검출에 기초한 상기 선택을 무시하는 단계를 포함할 수 있다. 상기 제1 인코딩 타입은 상기 비디오에서 저하(Degradation)를 일으킬 수 있다. 상기 인코딩 타입을 무시하는 상기 단계는 상기 비디오의 다른 영역이 수신될 때까지 상기 2차적 정보를 인코딩하는 것을 지연하는 단계를 포함할 수 있다. 상기 검출하는 단계는 상기 검출이 상기 비디오 신호 내의 변화에 기초하는 것을 포함할 수 있다. 상기 무시하는 단계는 상기 추가 정보를 나타내는 데에 사용되는 내부-코딩 및 상호-코딩 사이에서 변화하는 단계를 포함할 수 있다. 상기 방법은 상기 비디오 신호내의 상기 추가 정보의 종료 및/또는 시작 중 적어도 하나를 지시하기 위해 외부의 시그널링을 사용하는 단계를 포함할 수 있다. 상기 추가 정보를 인코딩하기위해 사용되는 상기 여러 인코딩 타입은 내부-대 상호-예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변경, 및/또는 양자화 파라메터를 포함할 수 있다.

어떠한 측면에서, 어떠한 실시형태는 인코딩된 미디어 신호를 디코딩하는 단계와 복수의 여러 인코딩 타입 중 하나로서 상기 미디어 신호를 인코딩하는 것에 사용된 인코딩 타입을 결정하는 단계를 포함하는 방법을 특징으로 할 수 있다. 상기 방법은 미디어 인코딩 타입과 정보의 비트 사이의 관계에 접근하기 위해 상기 인코딩 타입을 사용하는 단계와 상기 디코딩하는 단계로부터 추가 정보로서 상기 정보의 비트를 획득하는 단계를 포함할 수 있다.

이들과 다른 실시형태들은 선택적으로 아래의 하나 이상의 특징을 포함할 수 있다. 상기 미디어 신호는 비디오 신호일 수 있고, 상기 미디어 인코딩 타입은 비디오 인코딩 모드를 포함할 수 있다. 상기 인코딩 타입은 상기 비디오 신호에서 복수의 예측 모드 중 적어도 하나를 포함할 수 있다. 상기 방법은 상기 정보의 비트로부터 시작 코드 및/또는 종료 코드 중 적어도 하나를 결정하는 단계, 및 상기 시작 코드 및/또는 상기 종료 코드에 인접한 추가 정보를 검출하는 단계를 더 포함할 수 있다. 상기 방법은 상기 비디오 신호의 여러 부분과 시간적으로 동기화 된대로 상기 추가 정보를 검출하는 단계를 포함할 수 있다. 상기 방법은 상기 추가 정보가 상기 비디오 신호에 연관되지 않는 것을 검출하는 단계를 포함할 수 있다. 상기 인코딩 타입은 상기 추가 정보를 나타내는 데 사용되는 내부-코딩 및 상호-코딩을 포함할 수 있다. 상기 방법은 비디오 신호내의 상기 추가 정보의 시작 및/또는 종료 중 적어도 하나를 지시하는 외부 시그널링을 검출하는 단계를 포함할 수 있다. 상기 추가 정보를 인코딩하는 데 사용되는 상기 여러 인코딩 타입은 내부-대 상호-예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터,변경, 및/또는 양자화 파라메터를 포함할 수 있다.

어떠한 측면에서, 어떠한 실시형태는 미디어 신호를 복수의 여러 예측 모드들 중 하나로 인코딩하기 위해 작동하는 미디어 인코더, 상기 미디어 신호의 부분으로서 인코딩될 추가 정보에 대한 입력, 상기 추가 정보에 기초하여 상기 복수의 예측 모드 중 하나를 선택하고 상기 추가 정보를 나타내기 위해 상기 추가 정보를 사용하는 결정부를 포함하는 장치에 관련된다.

이들 및 다른 실시형태는 선택적으로 하나 이상의 아래의 특징을 포함할 수 있다. 상기 미디어 신호가 비디오 신호 및/또는 오디오 신호를 포함할 수 있다. 상기 미디어 인코더가 스피치 인코더일 수 있다. 상기 결정부는 예측 모드를 추가 정보의 비트에 연관시키는 예측 테이블을 포함하고, 상기 테이블은 예측 모드들을 코딩 성능에 대한 영향을 감소시키기 위해 선택되는 시그널링 그룹으로 그룹화 할 수 있다. 상기 결정부는 코딩 성능에 대한 그것의 영향 때문에 고의로 상기 추가정보를 시그널링하지 않을 수 있다. 상기 추가 정보는 에러 정정 방법을 사용하여 사전에 인코딩될 수 있다. 상기 방법은 시작 코드 및/또는 종료 코드 중 적어도 하나를 저장하고 상기 인코더 타입을 사용하여 상기 추가 정보에 인접한 비디오 신호 위치 내에 상기 시작코드 또는 종료 코드 중 상기 적어도 하나를 나타내는 것을 더 포함할 수 있다.

이들 및 다른 실시형태는 선택적으로 아래의 하나 이상의 특징을 포함할 수 있다. 상기 시작 코드 및/또는 종료 코드가 실제 비디오에서 발생하기 어려운 인코딩 결정의 시퀀스를 나타낼 수 있다. 상기 추가 정보는 비디오 신호의 내용과 연관되고, 비디오 신호의 여러 부분과 시간적으로 동기화될 수 있다. 상기 추가 정보는 상기 비디오 신호에 연관되지 않을 수 있다. 상기 결정부는 대략 유사한 성능을 가진 코딩 방법을 나타내는 정보와 상기 사용이 코딩 성능에 미칠 영향을 감소시키는 코딩 방법의 그룹을 포함할 수 있다. 상기 비디오 인코더는 상기 2차적 정보에 기초하여 선택된 제1 인코딩 타입을 검출하고, 제1 인코딩 타입은 상기 비디오에서 저하를 일으킬 것이다. 상기 검출에 기초하여 상기 제1 인코딩 타입의 상기 사용을 무시할 수 있다. 상기 비디오 인코더의 상기 무시 동작은 상기 비디오의 다른 영역까지 상기 2차적 정보를 인코딩하는 것을 지연하는 것을 포함할 수 있다. 상기 비디오 인코더의 상기 무시 동작은 상기 추가 정보를 나타내 데 사용되는 내부-코딩 및 상호-코딩 사이에서 변화하는 것을 포함할 수 있다.

이들 및 다른 실시형태는 선택적으로 하나 이상의 아래의 특징을 포함할 수 있다. 장치는 상기 비디오 신호내의 상기 추가 정보의 시작 및/또는 종료 중 적어도 하나를 나타내는 외부의 시그널링에의 연결을 포함할 수 있다. 상기 추가 정보를 인코딩하는 데 사용되는 상기 여러 인코딩 타입은 내부-대 상호 예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변경, 및/또는 양자화 파라메터를 포함할 수 있다.

어떠한 측면에서, 어떠한 실시형태들은 인코딩된 미디어 신호를 디코딩하고 디코딩에 사용되었던 인코딩 타입을 결정하는 디코더를 포함하는 장치를 특징으로 한다. 디코더는 상기 미디어 신호를 디코딩했던 복수의 여러 인코딩 타입 중 하나를 결정한다. 장치는 상기 인코딩 타입을 수신하고, 비디오 인코딩 타입과 정보의 비트 사이의 관계에 접근하고 상기 디코딩으로부터 추가 정보로서 정보의 비트를 출력하기 위해 상기 인코딩 타입을 사용하는 논리부(Logic Part)를 포함할 수 있다.

이들 및 다른 실시형태는 선택적으로 아래의 특징 중 하나 이상을 포함할 수 있다. 상기 미디어 신호가 비디오 신호 및/또는 오디오 신호일 수 있다. 상기 미디어 디코더가 스피치 디코더일 수 있다. 상기 논리부가 상기 미디어 신호의 복수의 예측 모드와 상기 예측 모드에 연관된 비트를 저장할 수 있다. 상기 논리부는 또한 상기 정보의 비트로부터 시작 코드 및/또는 종료 코드 중 적어도 하나를 검출하고, 상기 시작 코드 또는 상기 종료 코드에 인접한 상기 추가 정보를 검출할 수 있다. 상기 논리부가 상기 미디어 신호에 포함된 상기 비트 정보에서 에러를 검출하고 정정할 수 있다. 상기 논리부는 상기 미디어 신호의 여러 부분과 시간적으로 동기화된대로 상기 추가 정보를 검출할 수 있다. 상기 논리부는 상기 추가 정보가 상기 미디어신호에 연관되지 않았음을 검출할 수 있다. 상기 논리부는 상기 미디어 신호내의 상기 추가 정보의 시작 및/또는 종료 중 적어도 하나를 나타내는 외부의 시그널링을 검출할 수 있다. 상기 추가 정보를 인코딩하기 위해 사용되는 상기 여러 인코딩 타입은 내부-대 상호 예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변경, 및/또는 양자화 파라메터를 포함할 수 있다.

여기에 설명된 기술과 방법 중 어떠한 것이든 시스템 기구 또는 장치, 기계, 컴퓨터 프로그램 제품, 소프트웨어, 하드웨어, 또는 이들의 어떠한 조합으로든 구현될 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 컴퓨터-판독가능한 매체(예를 들어, 데이터 저장 유닛)에서 유형적으로 인코딩될 수 있고, 그리고 데이터 프로세싱 장치(예를 들어, 데이터 프로세서)가 여기에서 설명된 어떠한 방법을 위한 하나 이상의 작동을 수행하기 위한 설명을 포함할 수 있다.

부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩

발명자들은 전송된 미디어 정보와 함께 2차적 정보를 전송하는 것이 요구될 때가 있다는 것을 알고, 미디어는 비디오, 오디오, 스틸 이미지 또는 다른 멀티미디어 정보를 포함할 수 있다. 실시형태는 단지 비디오에 관해 언급될 수 있지만, 오디오를 포함해서 다른 형태들 또한 커버되는 것을 의도했다는 것을 이해해야 한다. 이러한 2차적 정보는 정보를 나타낼 수 있고, 여기에서 설명된 특정한 함수에서 사용될 수 있다.

2차적 정보의 첫 번째 카테고리는 미디어 그 자체, 예를 들어 비디오,에 연관된 정보를 포함할 수 있다. 비디오 그 자체에 연관된 2차적 정보는 종종 메타데이타라고 불린다. 2차적 정보의 종류는 전송된 컨텐츠에 관한 부가적인 정보를 제공할 수 있다. 예를 들어, 비디오 전송 시스템에서 메타데이타의 다양한 용도는 저작권 알림에 관한 정보, 디코딩 프로세스를 향상 시키거나 도와주는 데에 사용될 수 있는 정보, 또는 비디오에 관한 추가 정보를 포함할 수 있다. 이러한 정보는 여러 가지 어플리케이션에서 사용될 수 있다.

2차적 정보가 메타데이타일 경우, 메타데이타를 미디어, 예를 들어, 비디오 피드에 동기화 시키는 것이 중요할 수 있다. 전송 계층의 변화가 수행될 때조차도 메타데이타 동기화(Syncronization)가 유지되어야 한다는 것은 또한 중요할 수 있다. 예를 들어, 메타데이타 신호내의 비트가 비디오 신호내의 픽쳐(Picture)의 블록 또는 매크로 블록과 연관되는 것이 요구될 수 있다.

또 다르게 2차적 정보는 부분적으로 또는 전체적으로 미디어에 연관되지 않은 비-메타데이타(Non-Metadata) 정보일 수 있다. 예를 들어, 그것은 비밀 통신, 또는 레가시 시스템의 지지를 위한 정보일 수 있다. 디코더가 특별히 특별한 디코딩 부분을 보유하지 않는 경우, 실시형태에서, 추가의 통신 채널은 디코더에 명백하다.

2차적 정보의 어플리케이션은 3-D 이미지 복원, 높은 동적 범위 이미지 생성, 디노이징(Denoising), 시적 보간법(Temporal Interpolation), 초 해상도 이미지 생성(Super Resolution Image Generation), 및 오차 은폐(Error Concealment)를 포함할 수 있다. 기술은 이것을 최종 수요자(End User)에게 비밀 메시지 또는 다른 정보를 제공하기 위해 사용할 수 있다. 시스템은 디지털 서명을 위해 사용될 수 있고, 예를 들어, 정보는 암호화 또는 비암호화 메시지를 전송하기 위해, 또는 그래서 디코딩된 비디오의 품질을 향상시키기 위한 전용 후-처리 시스템(Proprietary Post-Processing System)에서 사용될 수 있다. 다른 어플리케이션은 스테가노그라피(Steganography), 암호 작성술(Cryptography), 후 처리(Post Processing) 또는 레이트 쉐이핑(Rate Shaping)의 알림(Signaling), 트랜스코딩 힌트(Transcoding Hint), 에러 은폐(Error Concealment), 배우 또는 현재 장면의 위치와 같은 비디오 컨텐츠 정보, 광고 정보, 채널 가이드 정보를 포함하고, 여러 가지 타입의 비디오 스크램블링, 디스크램블링 코드 없이 보는 것을 허용하지 않는 제1 타입 또는 스크램블링 코드 없이 낮은 품질 이미지를 보는 것을 허용하고, 스크램블링 코드가 제공되는 경우 이미지를 향상시키는 제2 타입을 포함한다. 상기 2차적 정보는 바이오스 또는 다른 소프트웨어 업그레이드 정보, 및 유사한 것이 될 수 있다. 트릭 모드 기능은 어떤이가 현재와 미래의 픽쳐 사이의 관계에 관한 힌트를 제공할 수 있는 경우 지원될 수 있다. 이때 이 정보는 빠른 포워드 및 리와인드 기능을 제공하기 위해 디코더에 의해 활용될 수 있다. 이러한 시스템은 비트 레이트 스케일러빌러티 목적을 위해 또한 사용될 수 있다.

여기서 공지된 다수의 실시형태 중 어떠한 것이든 위의 어플리케이션 중 어떠한 것에 대해 어떠한 조합으로든 사용될 수 있다.

실시형태는 제1 실시형태에서 사용되는 MPEG-4 AVC 표준과 같은 코딩 시스템과 함께 작동되는 시스템의 사용을 설명한다. 이러한 코딩 시스템은 다양한 코딩 모드를 사용한 블록 파티션(Partition)을 나타낸다. 구체적인 모드는 가능한 효율적으로 블록 내의 정보를 압축하는 방식에 의해 인코더에 의해 일반적으로 선택된다. 여러 가지 모드는 비디오 신호내의 텍스쳐(Texture), 움직임, 조명변화를 예측하기 위해 여러 예측 기술을 사용한다. 예를 들어, 이것은 내부-예측과 상호-예측을 포함할 수 있다. 하위 파티션 방법이 또한 사용될 수 있다. 예를 들어, 블록의 내부-코딩은 4x4, 8x8, 16x16 예측 블록에서 예측될 수 있다. 상호-예측에서, 모드는 현재 부분, 예를 들어, 매크로 블록 또는 블록 내의 하위 파티션 방법을 알려줄 수 있다. 각 하위 파티션은 상호-예측에서 참조 픽쳐 인덱스와 더 연관되어 있을 수 있다. 변경 사이즈, 병진, 아핀 또는 다른 타입이 될 수 있는 움직임 벡터 그 자체, 및 가중치(Weight)와 같은 조명(illumination) 파라메터, 오프셋 파라메터, 여러 변환, 및 양자화 파라메터를 포함하는 움직임 벡터이상의 다른 정보 또한 사용될 수 있다.

내부-대 상호-예측(Intra-versus Inter-Preduction), 예측 방향(Prediction direction), 하위 파티션(Sub Partitioning), 참조 인덱스들(Reference Indices), 움직임(Motion) 및 조명 변화 파라메터(Illumination Change Parameter), 변환 (Transform), 및/또는 양자화 파라메터(Quantization Parameter)를 포함하는 신호를 코딩하는 이러한 여러 방법들 각각은 일반적으로 예측 정보로서 언급된다.

실시형태는 예측 정보와 특정한 데이터 비트 간의 관계를 나타내는 정보에 따라 추가 정보를 인코딩하기 위한 구체적인 종류의 예측 정보를 사용한다. 정보는 모드를 정보에 연관시키는 검색 테이블 혹은 다른 유사한 테이블일 수 있다.

도 1~5는 어떻게 코덱이, 예를 들어 MPEG-4 AVC/H.264 표준에 기초한 코덱, 매크로블록을 나타내는 다양한 여러 가지 모드를 사용할 수 있는지를 나타낸다. 예를 들어, 도 1에 나타난 매크로블록을 고찰해보자. 만약 어떤 이가 이것을 16x16 매크로 블록이 될 수 있다고 생각하면, 그때 전체 매크로 블록은 많은 수의 여러 방법들로 예측될 수 있다. 100은 단일 움직임 벡터(Single Motion Vector)를 가진 단일 16x16 파티션으로서 예측되는 매크로블록을 나타낸다. 102는 16x8 파티션을 나타내고, 반면에 104는 8x16 파티션을 나타낸다. 106은 8x8 파티션이 사용된 개별적인 4개를 보여준다.

유사한 방법으로, 각 파티션은 다른 움직임 벡터를 가질 수 있다. 쌍-예측(Bi-Predictive)의 경우에서, 어떤 이는 블록당 움직임 벡터의 두 집합을 전송할 수 있다. 움직임 보상 예측을 위해 16 레퍼런스(Reference)까지 있을 수 있고, 이는 8x8 블록 사이즈까지 낮추어 할당될 수 있다. 움직임 보상은 또한 쿼터 픽셀 정확도까지 낮춰서 수행될 수 있다. 가중된(Weighted) 예측 방법은 조명 변화가 존재하는 곳에서 특히 성능을 향상시키기 위해 사용될 수 있다.

내부-코딩에서, 코딩 성능을 향상시키는 내부-예측 모드가 사용될 수 있다. 예를 들어, 도 2는 다수의 다양한 4x4 블록 사이즈와 어떻게 내부-코딩이 이 블록 사이즈에서 수직(Vertical)(200), 수평(Horizontal)(202), DC(204), 사선 아래 왼쪽(Diagonal down left)(206), 사선 아래 오른쪽(Diagonal down right)(208), 수직 오른쪽(Vertical right)(210), 수평 오른쪽(Horizontal Right)(212), 수직 왼쪽(Vertical Left)(214), 수평 위(Horizontal Up)(216)인 모드를 생산하기 위해 사용될 수 있는지를 나타낸다. 이러한 예측 모드들은 각 4x4 블록에 대해 9개의 예측모드를 제공한다.

예측은 또한 다른 블록 사이즈에서도 수행될 수 있다. 예를 들어, 도 3은 어떻게 AVC가 예측을 위해 내부 16x16 예측 모드를 고려할 수 있는지를 나타낸다. 400은 수직 예측 모드를 나타내고 402는 수평 예측 모드를 나타내고, 404는 DC 예측 모드를 나타내고 및 406은 평면(Planar) 예측 모드를 나타낸다. 예측은 8x8 모드를 사용하는 AVC 내에서 수행될 수 있고, 반면에 현재 또는 미래의 다른 코덱은 다른 예측 블록 사이즈 또는 모드를 고려할 수 있다.

도 4 및 5는 개별적으로 4x4 블록 사이즈의 내부 예측 블록과 AVC 내의 그것들의 개별적 스캐닝 순서를 나타낸다.

이러한 도면들은 코딩에 사용될 수 있는 여러 가지 예측의 일부를 나타낸다. 인코더는 일반적으로 작동에 선호되는 모드를 제공하는 코딩 모드를 선택할 수 있다. 대부분의 경우, 선택은 미리 결정된 품질 척도, 비트의 수, 및/또는 복잡도에 관한 최고의 품질을 제공하는 코딩 예측에 기초한다. 발명자는 선택 프로세스가 그 자체로 정보를 인코딩하기 위해서 사용될 수 있다는 것을 인식하였고 -그래서 구체적인 모드가 정보를 인코딩한다.

실시형태에 따르면, 인코딩에 사용되는 구체적인 모드는 결정론적 (Deterministic) 방법으로 선택될 수 있다. 구체적인 선택은 추가 정보를 나타내기 위해 이루어진다.

도 6은 비디오 스트림내의 부가적인 정보를 인코딩하기 위한 이러한 결정론적(Deterministic) 코더(600)를 사용하는 실시형태를 나타낸다. 결정론적 코더(600)는 도 6에 나타나고, 비디오(605)를 받아서 인코딩되게 하고, 인코딩된 비디오(610)을 생성한다. 위에 설명된 것처럼, 이것은 MPEG-4 AVC 표준, 또는 다수의 여러 인코딩 방법 중 하나를 사용하여 인코딩 할 수 있는 어떠한 다른 코딩 방법을 사용할 수 있다. 하지만, 도 6의 결정론적 코더는 어떠한 예측 또는 코딩 방법이 사용되는지 결정하기 위해 모드 테이블(620)을 사용할 수 있다. 추가 정보(625)는 코더로 입력된다. 모드 테이블(620)은 여러 예측/코딩 방법과 이러한 코딩 방법에 의해 나타나는 추가 정보의 디지털 비트 간의 관계를 구체화한다. 작동에서, 코더(600)는 추가 정보를 나타내기 위해 모드 테이블(620)로부터 모드를 선택하기 위한 추가 정보에 기초하여 동작한다.

인코딩된 비디오(610)는 추가 정보(625)에 따라 인코딩된다. 하지만, 비디오는 표준을 따라 인코딩되고 부가된 특별한 부분이 없기 때문에 650과 같은 특별한 디코더 뿐만 아니라 690과 같은 레가시 디코더도 이 비디오(610)을 디코딩할 수 있다. 레가시 디코더(690)는 비디오를 디코딩하고 출력 비디오(699)을 생성한다. 추가 정보는 손실될 것이지만, 디코딩은 영향을 받지 않는다.

2차적 정보는 모드 정보를 디코딩하도록 설정된 디코더(650)로부터 검색될 수 있다. 디코더(650)은 인코더(600)에 의해 사용되는 것과 동일한 모드 테이블일 수 있는 모드 테이블(621)을 포함한다. 모드 테이블(621)은 실제로 사용되는 코딩 방법의 선택으로 인코딩된 추가 정보를 디코딩하기 위해, 어떠한 인코딩 모드가 사용될 것인지에 대한 디코더의 결정에 의해 산출된다. 디코더 내의 논리 모듈(651)은 비디오(610)가 특별히 이 정보와 함께 코딩이 되었다는 것을 결정하고, 또한 비디오와 모드 테이블로부터 추가 정보(652)을 또한 검색하고, 그것을 출력한다. 출력 추가 정보는 비디오 영역, 예를 들어, 그것을 포함한 프레임,에서 시간-동기화될 수 있다.

모드 테이블은 정보의 바이트 또는 비트와 구체적인 코딩 블록 타입간의 관계를 확립함으로써 형성된다. 예를 들어, 테이블 1은 내부-매크로블록 타입과 그것의 추가 데이터 심볼에 대한 할당을 나타낸다.

테이블 1- 내부 매크로블록 타입 및 메타데이터 심볼로의 그것들의 배치.

물론, 이것은 단지 하나의 예이고, 여러 비트들은 여러 모드들과 연관될 수 있다.

테이블 1은 어떻게 내부-코딩 모드가 2차적 정보 데이터 스트링으로부터 비트를 전송하기 위해 사용될 수 있는지를 보여준다. 여러 매크로블록 타입은 다른 제2 데이터 신호를 나타낸다. AVC를 사용하는 실시형태에서, 색차(Chrominance) 예측조차 고려함이 없이, 다른 내부 4x4 예측 모드의 9의 16승개의 다른 가능한 조합이 있다. 부가적인 조합은 8x8 또는 16x16 내부-예측, 및 색차 예측을 위한 모드를 사용하여 얻어질 수 있다. 이러한 실시형태에서의 예측은 최고 효율적인 코딩 방법에 의하는 것 보다 추가 정보에 의해 영향을 받는다. 다른 표준 또는 미래의 표준은 더 많거나 더 적은 모드를 사용할 수 있다.

하지만, 구체적인 비디오 예측을 강요하는 것은 하위 최적 코딩 시스템을 만들 수 있다. 실시형태에서, 부적절한 예측으로 인한 어떠한 아티팩트(Artifact)도 잔차(Residual)의 이후 코딩에 의해 보상될 수 있다. 이것은 품질 효과를 완화시킬 수 있다.

어떠한 실시형태에 따르면, 예측 신호는 성능 장애를 최소화하기 위한 시도를 위한 방법으로 분류된다. 예를 들어, 실시형태는 예측에 관한 그들의 유사성에 따라 모드를 나눌 수 있다.

AVC와 같은 비디오 압축에서, 동시의 인코딩 결정들은 미래의 결정과 성능에 영향을 끼칠 수 있다. 특히, 이미지 블록을 모드 A0로 코딩하는 것은 가치 비용(Cost) 0의 레이트 왜곡 비용을 도출하는 것을 가능하게 한다. 그럼에도 불구하고 이러한 제1 코딩 결정은 주변의 블록의 압축 수행에 또한 전반적으로 영향을 끼칠 수 있다. 특히 만일 주변의 블록이 B0 모드로 코딩된다면, 비용1을 결과로 할 수 있다. 그러므로, 모드 A0와 B0를 사용하는 두 블록의 전체 비용은 비용0 + 비용1이다.

대안적인 결정이 첫 번째로 모드 A1 그리고 두 번째로 모드 B1으로 이 블록들을 코딩할 수 있다. A1, B1은 제1 블록에 비용2와 제2 블록에 비용 3을 발생시킬 수 있다. 전체 비용은 비용2 + 비용3이다.

비록 비용0 < 비용2이 가능하지만, 비용2 + 비용3이 비용0 + 비용1에 유사한 것 또한 가능하다(두 블록의 공동 왜곡(Joint Distortion)). 이것이 발생한 경우, A0이후에 모드 B0를 사용하는 것이 A1 이후에 B1을 사용하는 것과 동일하다고 말할 수 있다.

본 실시예는 각 모드 또는 이 경우는 모드 쌍,에 여러 2진 서명을 할당한다. 이것은, 예를 들어, A0B0에 “0”을 할당하고 A1B1에 “1”을 할당한다. 그들은 동일한 성능을 가지기 때문에, 정보는 인코딩에 관련된 비용없이 선택에 의해 전송될 수 있다.

이러한 분리는 동일한 수행 측면(Performance Wise)인 블록 쌍이 존재한다는 것과 압축을 위한 좋은 모드가 또한 찾아질 수 있다는 것을 보장할 수 있다.

이 기술은 더 많은 블록, 모드, 및 전송된 비트에서 일반화되어 있다. 예를 들어, 도 4는 여러 가지 모드의 조합이 될 수 있는 16개의 여러 가지 4x4 블록을 보여준다. 이 조합들 중 일부는 동일한 수행을 그 결과로 하고, 이것은, 만약 측정된다면, 어떻게 메타데이타 이진 서명을 모드 조합에 할당할 수 있는지 결정할 수 있다.

이것에 기초해서, 테이블 1은 A 및 B로 표시된 두가지 다른 2차적 정보 심볼을 보여준다. 테이블 1은 어떻게 도 4에서 블록 a00에서 모드 0과 블록 a01에서 모드 1의 조합이 블록 a00과 a01에서 각각 모드 2과 모드 0의 그것에 평균적으로 유사한 수행을 제공하는지 보여준다. 동일한 결정 규칙이 오버헤드 신호전달 정보 없이 2차적 정보를 검출하고 디코딩하는 디코더에 의해 사용될 수 있다. 실시형태에서, 시작 및 종료 코드는 2차적 정보 부분의 경계를 정하는 데 사용될 수 있다. 다른 오버헤드 신호전달 정보는 디코딩 프로세스에 힌트를 제공하거나 도와주는 데 사용될 수 있다.

일 실시예는 어떠한 예측 모드가 시그널링 목적을 위해 효율성의 영향를 줄이는 방식으로 함께 모아질 수 있는지를 분류하기 위한 기술을 사용한다.

이 실시예는, 예측 샘플 P_i의 집합이 모든 또는 일부 가능한 내부-예측 모드를 사용하는 모든 또는 대부분의 예측 블록을 생성하기 위해 사용된다.

각 내부-예측 모드 j에서, P_i는 예측 블록 B_ij를 그 결과로 한다.

각 B_ij에 대해, 절대적인 거리 대 모든 다른 예측 모드는 모드 j와 k사이의 거리 (B_ij-B_ik)인 D_ijk로 결정된다.

모드j 대 모드k의 평균 거리 누적된 합은

로서 계산된다(1).

이것은 그래프 이론을 이용하고 두 예측 모드간의 비용으로서 누적 거리를 선택함으로써 평가된다. 예측 모드는 그들을 최단 경로 문제(Shortest Path Problem), 예를 들어 여행하는 세일즈맨 문제,로서 고려함으로써 분류된다. 해결책에 기초하여, 모든 또는 어떠한 예측 모드는 최고 코딩 수행을 위해 파티션될 수 있다.

더욱 구체적으로, 그래프에 있는 각 노드는 최단 경로 문제에 따라 스캔될 수 있고, 각 노드는 이러한 순서에 기초한 다른 클러스터/심볼에 할당된다. 만일 M>N인 N 심볼과 M 분류된 노드가 있다면, 노드 M은 심볼

에 할당되고

는 모듈로 연산자(Modulo Operator)이다.

차선이지만 단순한 해결책은 우선적으로 문제를 다수의 하위-문제로 분열시킴으로써 또한 고려될 수 있고, 각 하위-문제는 유사한 기술을 사용하여 최적화를 위해 내부-예측의 부분집합(Subset)을 단순히 고려한다. 이러한 부분집합은 반대의 예측 방향의 두 모드가 이미 매우 비유사하다고 알려져 그러므로 함께 고려될 수 있다는 사실과 같은 미리 정의된 규칙을 사용하여 결정될 수 있다.

또 다른 실시형태는 현재의 매크로 블록을 다른 사이즈, 예를 들어, 4x4, 4x8, 8x4, 또는 VC-1, AVS, VP-6, 또는 VP-7과 같은 다른 코덱에 의해 지원될 수 있는 다른 매크로 블록 사이즈로 인코딩하기 위해 트랜스폼을 시그널링한다.

또 다른 실시형태는 이것을 P 및 B 슬라이스와 같은 상호 슬라이스로 수행할 수 있다. 모든 가능한 내부-코딩 모드가 정보를 전송하는 데 사용될 수 있음에도 불구하고, 그들은 상호/움직임 보상된 코딩 모드(Inter/Motion Compensated Coding Mode)에 비하면 낮은 코딩 효율을 가질 수 있다. 그래서, 내부-코딩 모드의 사용은 코딩 효율이 더 나빠지게 할 수 있다. 상호-모드는 슬라이스 타입 내의 시그널링을 위해 사용될 수 있다.

도 1은 어떻게 AVC 표준이 움직임 보상을 위해 개별적으로 16x16, 16x8, 8x16, 및 8x8 파티션을 개별적으로 지원하는 100, 102, 104 및 106으로 나타난 상호-예측을 사용하는 매크로블록을 인코딩하기 위한 4개의 다른 파티션 타입을 제공하는지를 나타낸다. 각 8x8 파티션은 도 1의 108로 나타난 8x8, 도 1에 110으로 나타난 8x4, 도 1에 112로 나타난 4x8, 도 1에 114로 나타난 4x4의 4개의 작은 하위 파티션으로 더 분할될 수 있다. 레벨과 어떠한 매크로블록이 사용될 수 있는 지 검출하는 프로필 제약조차 무시하여도, 이것은 여전히

의 가능한 조합(8x8 하위파티션에서), 또는 매크로블록당 8비트를 허용한다.

각 8x8 파티션은 또한 16개의 다른 참조 인덱스로까지 또한 고려될 수 있다. 조합과 그러므로 시그널링에 의해 나타난 서명의 수는 매우 높아진다. 예를 들어, 16 참조를 사용하는 것은

의 가능한 조합 또는 매크로 블록당 24 비트까지 허용한다.

모드는 코딩 오버헤드와 성능 영향(Performance Impact)을 줄이기 위해 또한 클러스터화 될 수 있다. 비트 시그널링을 위한 상호-모드의 사용은 시각적 품질에 작은 영향을 가진다.

다른 실시형태는 역량과 압축 효율간의 트레이드-오프를 제공하기 위해 시그널링 목적을 위한 단지 제한된 수의 모드만을 사용할 수 있다. 이 실시형태에 따르면, 단지 상호 매크로블록 파티션은 8x8 하위 매크로 파티션의 참조 인덱스를 무시하는 시그널링을 위해 사용된다. 이것은 여전히 매크로블록당 두 비트까지 시그널링을 허용한다. 인코더는 조합과 연관된 모드를 사용하고 모든 다른 모드를 허용하지 않음으로써 특정한 비트 조합을 시그널링할 수 있다. 움직임 추정과 참조 인덱스 선택은 보통의 인코더에서처럼 동일한 방법으로 수행될 수 있다. 396 메크로 블록을 포함하는 CIF 해상도(352x288)에 대해, 이것은 프레임당 396x2=792 비트 또는 99바이트 정보까지의 전송 능력을 제공한다.

테이블 2는 P 슬라이스에서 상호-매크로블록 타입과 심볼 배정을 나타낸다.

테이블 2 - P 슬라이스에 대한 상호 MB 타입들 및 추가 정보 심볼에 가능한 할당

방법은 B 슬라이스까지 확장될 수 있다.

테이블 3은 어떻게 8x8 매크로블록 파티션까지 낮아진 B 슬라이스의 상호-모드가 각 네 비트 메시지로 배정되는지를 나타낸다. P 슬라이스에 대한 유사한 방법으로, 주어진 네 비트 메시지에서, 인코더가 시그널링을 하기 위한 적당한 모드를 선택한다. 선택은 2차적 정보를 인코딩한다.

테이블 3-B슬라이스에 대한 상호 MB 타입 및 메타데이터 심볼로의 가능한 배정.

모드에서 증가를 고려하면, 시그널링은 더 많은 비트를 커버하기 위해 확장될 수 있다.

어떠한 모드는 수행을 향상시키거나 품질 저하를 줄이기 위해 메타데이타 시그널링으로부터 배제될 수 있다. 예를 들어, 매크로블록 j가, 현재 2차적 정보 심볼

에 의해 영향을 받는 모드에 비교하여, 제외된 모드 중 하나를 사용하는 더 좋은 품질과 성능으로 인코딩되는 상황을 가정하면, 제외된 모드는 인코딩을 위해 선택될 수 있다. 심볼

는 대신에 매크로블록

또는 심볼 j에 의해 좌우된 모드와 비교한 그룹 코딩 성능에서 제외된 모드가 커다란 향상을 제공하지 못하는 제1 이후 매크로 블록을 인코딩하기 위해 사용된다.

예를 들어, 만약 새로운 영역이 커버되지 않거나 또는 새로운 물체가 비디오 장면에 나타나면, 품질에 영향을 주는 것 없이 또한 2차적 정보 신호에 대한 비트의 손실없이 안전하게 내부-코딩을 사용할 수 있다. 단일 프레임의 내포 역량(Embedding Capacity)은 감소될 수 있지만, 그러나 압축 효율과 차후 품질에 대한 상응하는 영향은 낮아질 수 있다.

어떤 이는 2차적 정보 심볼과 연관된 모드를 선택하는 것과 비교하여 압축 효율 목적에 대한 제외된 모드를 선택하는 것 사이에서 인코더의 오차(Tolerance)를 또한 조정할 수 있다. 이것은 내포 역량(Embedding Capacity)와 코딩 성능사이에 트레이드-오프를 제공한다.

너무 많은 2차적 정보는 압축 효율에 영향을 끼칠 수 있다. 어떤 시나리오는 2차적 정보가 비디오 시퀀스내의 단지 일부의 프레임 또는 픽쳐에 삽입되도록 요구할 수 있다. 2차적 정보는 일부의 픽쳐(프레임) 또는 단지 비트스트림내의 특정한 픽쳐에 부가될 수 있다. 예를 들어, 이것은 주기적(Periodic) 또는 슈도렌덤 방식(Pseudorandom Fashion)으로 할 수 있다. 실시예로서, 이것은 2차적 정보를 빨리 감기(fast-forward) 및 뒤로 감기(Rewind) 또는 렌덤 엑세스(Random Access)와 같은 비디오 트릭 모드를 활성하는 것에 제공할 수 있도록 사용될 수 있다. 비록 메시지가 알거나/미리 정해진 위치에 삽입될 수 있기는 하지만, 메시지는 다양한 이유에서 임의의 위치에 삽입될 수 있다. 그러므로 그러한 경우 그 존재를 검출가능한 것이 중요하고, 그러므로 메시지를 완전히 디코딩 가능한 것 또한 중요하다.

일 실시예에 따르면, 디코더(650)는 메시지를 검출할 수 있어야만 하지만, -메시지가 존재하지 않을 경우 메시지를 검출하는 것을 피하기 위해서 의도적으로-인코딩된 메시지를 검출하는 것을 보장해야한다. 메시지가 존재함에도 불구하고 메시지를 검출하지 않는 음성 오류(False negative)를 피하는 것이 비슷하게 중요하다. 실시형태에서, 시작 코드와 종료 코드는 2차적 정보를 전송하기 전 및 후에 비디오 스트림내에 포함된다. 시작 코드 및 종료 코드는 실제의 2차적 정보에 사용되는 것과 동일한 기술을 사용하여 비디오 스트림 내에 내포된 미리 정의된 비트 시퀀스를 사용할 수 있다. 예를 들어, 이것은 비트의 시퀀스를 매크로블록 및/또는 블록 코딩 모드에 매핑함으로써 이루어질 수 있다.

이 코드들은 음성 오류를 피하기 위해서 실제 비디오에서 드물게 또는 절대 나타나지 않는 인코딩 결정 시퀀스로서 선택된다. 예를 들어, 이것은 상대적으로 각각 우선 16곱8 파티션, 다음으로 8곱16 파티션, 또 16곱8 파티션으로 인코딩된 세 개의 인접한 매크로블록에 접할 가능성이 낮을 수 있다. 이 모드들이 수평 에지(Edge)에서 물체의 에지에 강한 관계를 가지기 때문에 이 조합은 가능성이 낮다. 이것이 일어날 수 있는 유일한 때는 물체가 수직 방향에서 왼쪽 및 오른쪽 매크로블록 내의 수평 에지를 가질 때이다.

다른 실시형태는 단지 이러한 목적으로만 사용될 수 있는 시작 코드와 종료 코드를 가질 수 있고 비트스트림내의 어떠한 다른 목적으로도 사용될 수 없다. 이 실시형태는 검출를 향상시킬 수 있다.

대안적인 시작 코드는 네 개의 매크로블록과 순서대로 모드 16x16, 8x8, 16x16 및 8x8을 사용하는 것을 나타낼 수 있는 시퀀스 0110011을 사용해서 전송될 수 있다.

시작 코드 시퀀스의 길이를 늘리는 것은 이에 상응하여 음성 오류의 가능성을 감소시킬 수 있다. 하지만, 비디오 스트림의 내포 역량을 감소시키는 비용을 지불하고 그렇게 할 수 있다. 시작 코드의 길이와 음성 오류 사이의 트레이드-오프는 그러므로 생각한 의도된 어플리케이션으로 신중하게 조사되어야 한다. 예를 들어, 낮은 해상도 비디오로 의도된 어플리케이션은 짧은 시작 코드를 사용할 수 있고, 고화질 자료(High Definition Material)은 견고성(Robustness)를 향상시키기 위해 더 긴 시작 코드를 요구할 수 있다.

2차적 정보는 즉시 시작 코드를 따라간다. 일 실시형태에서, 메시지 데이터의 크기는 고정된 수 M일 수 있다. 동적 길이 정보(Dynamic Length Information)은 시작 코드 직후 2차적 정보의 비트 또는 바이트로 또한 전송될 수 있다.

도 7은 테이블 2의 시그널링 방법에 따른 추가 정보를 두는 실시형태를 나타낸다. 각 박스, 도 7의 700 같은, 매크로블록 또는 프레임 또는 픽쳐를 나타낸다. 길이 코드(710)은 시작 코드(705)를 따르고, 2차적 정보의 길이를 나타내는 네 매크로블록으로부터 여덟 비트를 만든다. 메시지는 이것을 따르고, 715와 함께 시작된다. 720은 메시지의 종료를 전송하는 종료 코드를 표시한다. 만일 종료 코드 서명이 예상된 위치에서 접하지 못한다면, 이것은 정보가 유효한 메시지를 나타내지 못하거나 일부의 다른 에러가 발생했다는 것을 시사한다. 점검(Checking)은 여기에서 설명된 것처럼 도 11의 부분에 나타나있다.

일 실시형태에서, 시작 코드와 종료 코드 메시지는 시퀀스내의 다수의 인접한 픽쳐들에 걸쳐있을 수 있다.

다른 실시형태는 시작 및 종료 코드 대신에 메시지의 위치와 존재를 전송하기 위해서 외부의 시그널링 방법을 사용한다. 예를 들어, 일 실시형태는 기존의 추가의 향상 메시지(Existing Supplement Enhancement Message(SEI))를 사용하여 이것이 수행될 수 있도록 한다.

음성 오류는 동일한 픽쳐내 또는 시퀀스내의 많은 픽쳐의 메시지를 반복함으로써 감소될 수 있다. 예를 들어, 반복되지 않는 메시지는 노이즈 또는 에러로 가정될 수 있다. 그러므로 만일 다음의 픽쳐에서 정확하게 동일한 시퀀스의 시작 코드/메세지/종료 코드를 가지지 않는 가능한 시작 코드/메세지/종료 코드라면, 그것은 버려질 수 있다.

시작 코드와 종료 코드가 픽쳐 사이에서 변하지 않을 필요는 없다.

페러티(Parity) 방법을 사용하는 에러 정정 방법과 데이터 입증은 또한 음성 오류를 줄이고 메시지의 강건성(Robustness)를 향상시키기 위해 메시지를 인코딩하는 데에 사용될 수 있다.

부가하여, 어떠한 매크로블록은 2차적 정보 신호의 좋은 후보가 될 수 없고, 제외된 모드(Excluded Mode)로 인코딩되는 것이 선호될 수 있다. 제외된 모드 매크로블록은 실제 메시지의 비트 수를 전송할 때 고려될 필요가 없다.

일 실시형태에서, 에러가 압축 효율을 위해 메시지내에서 삽입되도록 하는 것이 선호될 수 있다. 위에서 설명한 것처럼, 매크로블록 제2 코딩을 위해 선택된 모드가 코딩 효율에 부정적인 영향을 가지는 것이 가능할 수 있다. 만일 에러 정정 기술이 비트스트림에 메시지의 비트를 내재시키기 전에 사용된다면, 메시지의 회복능력에 영향을 끼치는 것 없이 메시지 에러가 의도적으로 부가될 수 있다.

도 8은 현재의 어플리케이션 기술을 사용하는 비디오 인코더를 보여준다. 입력 비디오(800)은 변경 장치(Transform Device)(802)에 의해 변경되고 양자화 장치(Quantization Device)(804)에 의해 양자화된다. 피드백 구조(806)는 루프 필터(810)에 의해 형성된 루프의 일부로서 움직임 예측 모듈(868)과 움직임 보상과 내부-예측 모듈(808)을 따라 사용된다. 픽쳐 참조 스토어(Picture Reference Store)(812) 또한 사용된다. 이것들 각각은 예측과 압축을 수행하기 위해 함께 사용될 수 있고, 비트스트림(815)를 생산한다. 메시지(820)는 선택적인 암호화 유닛(Encryption Unit)(822), 과 선택적인 에러 정정 인코더(824)에 입력이다. 모드 매핑(826)은 위에서 설명된 것처럼 메시지(820),와 비디오 인코딩의 모드 사이에서 모드 매핑을 수행할 수 있다.

도 9는 예시적 디코더를 나타내는데, 이것은 비트스트림(815)를 수신하고 역 양자화(Inverse Quantization), 역 변경(Inverse Transformation), 및 움직임 보상(Motion Compensation)뿐만 아니라 참조를 위해 픽쳐를 저장하는데 또한 사용될 수 있는 참조 픽쳐 버퍼를 사용해 비트스트림을 디코딩하는 예시적 디코더를 나타낸다. 만일 메시지(820)를 출력할 필요가 있다면, 메세징 검출기와 모드 맵핑 장치(900)는 예를 들어, 시작 및 종료 비트를 검출, 에러 정정 디코더(902)로 에러 정정을 디코딩, 복호화 장치(904)를 사용해 복호화함으로써 메시지의 검출를 수행한다.

다른 실시형태는 트랜스코딩 유닛을 설명하는데, 이미 메타데이타를 그 안에 가진 비트스트림이 트랜스코드되고, 다른 비트 레이트, 다른 해상도로 또는 다른 코덱을 사용하여 인코딩되지만, 거기에 2차적 정보를 보유한다.

도 10에 나타난 다른 실시형태는 메시지 로케이터(Locator)라고 불리는 독립된 메시지를 첫 번째 인코딩하는 것을 포함한다. 메시지 로케이터는 어떻게 및 어디에서 실제의 메시지가 차후의 프레임 및 비디오내에서 디코딩될 수 있는지에 대한 정확한 정보를 제공한다. 예를 들어, 메시지 로케이터는 위치, 메시지를 임베딩하는데 사용되는 위치, 비트 매핑을 위한 모드, 암호화 방법, 및 신호의 일반적인 복원에 관한 다른 정보에 대한 로드 맵을 제공할 수 있다.

도 10에서, 메시지 로케이터(1000)는 시작 코드(1002)다음에 바로 온다. 이것은 시간과 공간에서 메시지의 실제 위치, 및 실제 메시지의 크기가 검출되도록 한다. 도 10에 나타난 것처럼, 메시지 로케이터(1000)는 다른 시간에서 다른 매크로블록에 있는 위치(1010)를 가리킨다. 메시지 로케이터는 시간 t에 픽쳐 내에 있고, 한편 메시지 로케이터에 의해 참조된 매크로블록은 시간 t+1에 픽쳐 내에 있다.

그러므로 원래 메시지의 시간 및 공간은 이러한 방식으로 인코딩될 수 있다. 만일 메시지 로케이터가 암호화되면, 침입자(Intruder)가 실제로 1010에서 시작되는 메시지를 검출하는 것은 매우 어렵게 한다.

도 11은 마킹 실시형태의 플로우차트를 나타낸다. 1100에서, 비디오 코딩이 시작하고, 1102에서 각 프레임에서, 1104에서 위치가 표시되어야 하는지를 결정한다. 만일 그렇다면, 각각 시작 코드의 시작 위치, 비트 사이즈, 메시지 사이즈 및 종료 코드 사이즈를 나타내는, scpos, scsize, mdsize 및 ecsize는 1106에서 그들의 초기 값을 설정한다. 1108은 여러 값의 크기와 위치를 나타내는 값을 결정하는 것을 나타내고, 이후 1100에서 모드 결정이 된다. 1112는 이 모드 결정에 따라 매크로 블록을 코딩하는 것을 나타낸다.

위에서는 비디오 압축을 이용하는 실시형태를 설명했다. 하지만, 여기서 공개된 기술은 오디오와 스피치 코덱을 포함하는, 다른 미디어에 적용될 수 있다. ISO/MPEG-4 AAC 압축 표준은 여기에 공개된 기술을 사용하는 추가 정보의 전송에 사용될 수 있는 다수의 오디오 코딩 모드를 포함한다. 예를 들어, 코덱은 양자화된 변경 계수의 손실없는 인코딩을 위한 11개의 선택할 수 있는 Huffman 코드북을 적용한다. 주어진 오디오 샘플의 입력 프레임에서, AAC 인코더는 코딩 변경 계수에 요구되는 비트의 수를 최소화하는 Huffman 코드북의 집합을 선택할 수 있다. 이 실시형태의 AAC 인코더는 전송될 메타데이타 비트를 수신할 수 있고 Huffman 코드북의 선택을 그에 따라 변경할 수 있다. 이후의 인코딩 결정에 의해 적어도 부분적으로 오프셋이 될 수 있는 코딩 모드는, 차선의 상태를 설정할 때, 또한 사용할 수 있다. 실시형태는 변경 윈도우 타입(sine/KBD), 조인트 스테레오 코딩 결정(Mid/Side coding), 및 TNS 필터 길이, 순서(Order), 해상도, 및 방향을 포함한다. AMR NB 스피치 코덱 내에서, 코드화된 펄스의 위치와 표시, LPC 모델 계수(벡터 양자화된 선 스펙트럼 쌍), 및 피치 레그(Pitch Lag)는 이 실시형태에 의해 사용될 수 있는 코딩 모드의 역할을 한다.

더 일반적인 목표를 수행하는 여러 가지 방법에 영향을 끼치는데 사용될 수 있는 일반적인 구조와 기술, 및 더 구체적인 실시형태는 여기에서 설명된다.

비록 단지 약간의 실시형태가 상세하게 위에서 공개되어 있긴 하지만, 다른 실시형태가 가능하고 발명자는 이것들이 이 명세서내에 포함되는 것을 의도한다. 명세서는 다른 방식으로 수행될 수 있는 더욱 일반적인 목표를 달성하기 위해서 구체적인 예들을 설명한다. 이 공지는 예시적인 것으로 의도되고, 청구항은 당업자에게 예측될 수 있는 어떠한 변형 또는 변경을 포함하도록 의도된다. 예를 들어, 다른 인코딩 프로세스가 사용될 수 있다. 이 시스템은 다른 미디어와 함께 사용될 수 있다. 더욱이, 비록 특징들이 위에서 특정한 조합으로 작동하는 것으로서 설명될 수 있고 처음부터 그처럼 청구되어 있어도, 요구된 조합으로부터의 하나 이상의 특징들은 일부의 경우에서는 조합으로부터 삭제되고, 요구된 조합은 하위 조합 또는 하위 조합의 변형으로 관리될 수 있다.

또한, 발명자는 오직 “~의 수단”이라는 단어를 사용하는 청구항들만이 35 USC 112, 여섯 번째 문단에 따라 해석된다는 것을 의도한다. 만약 이러한 제한들이 청구항에 명확하게 포함되어 표현되지 않으면, 더욱이 본 명세서로부터 어떠한 제약이 어떠한 청구항 중에도 나타나도록 의도되지 않았다. 여기에 설명된 컴퓨터는 워크스테이션이나 셋-톱 박스같은 일반적인 목적이나 어떠한 구체적인 목적의 어떠한 종류의 컴퓨터든 될 수 있다. 컴퓨터는 윈도우 XP 또는 리눅스를 사용하는 펜티엄급 컴퓨터가 될 수 있거나 메킨토시 컴퓨터가 될 수 있다. 인코딩 및/또는 디코딩은 FPGA 또는 칩과 같은 하드웨어로 구현될 수 있다. 프로그램은 C 또는 자바 또는 다른 프로그래밍 언어로 쓰여질 수 있다. 프로그램은 예를 들어 자기 또는 광학, 예를 들어, 컴퓨터 하드 드라이브, 이동 디스크 또는 이동 매체에 저장될 수 있다. 예를 들어, 로컬 기계가 여기에 설명된 작동을 수행하도록 하는 프로그램은 또한 로컬 기계에 신호를 전송하는 서버와 다른 기계를 사용하여 네트워크상에서 작동될 수 있다. 본 개시의 특정 실시예들이 설명되었지만, 다른 실시예들이 이하의 청구항 범위내에 있다.

Claims

이산-시간 미디어 신호를 인코딩하는 방법으로서,
미디어 신호를 수신하는 단계;
상기 미디어 신호 내에서 인코딩될 추가 정보를 획득하는 단계;
복수의 여러 인코딩 타입과 상기 추가 정보의 디지털 비트들 사이의 관계를 나타내는 모드 테이블에 접근하는 단계;
상기 추가 정보와 상기 복수의 여러 인코딩 타입 사이의 매핑에 기반하여 상기 복수의 여러 인코딩 타입으로부터 하나의 인코딩 타입을 선택하는 단계; 및
상기 인코딩 타입이 상기 추가 정보를 표현하도록, 상기 선택된 인코딩 타입을 사용하여 상기 미디어 신호를 인코딩하는 단계를 포함하되,
상기 미디어 신호를 인코딩하는 단계는, 상기 추가 정보에 기초하여 선택된 제1 인코딩 타입을 검출하는 단계와 상기 검출에 기초한 상기 선택을 무시하는 단계를 포함하고,
상기 제1 인코딩 타입은 비디오에서 저하(Degradation)를 일으키며,
상기 인코딩 타입을 무시하는 상기 단계는 상기 비디오의 다른 영역이 수신될 때까지 상기 추가 정보를 인코딩하는 것을 지연하는 단계를 포함하는, 인코딩 방법.
청구항 1에 있어서,
상기 미디어 신호는 비디오 신호인, 인코딩 방법.
청구항 2에 있어서,
상기 인코딩 타입은 상기 비디오 신호를 위한 복수의 예측 모드들 중 적어도 하나를 포함하는, 인코딩 방법.
청구항 3에 있어서,
상기 예측 모드들을 코딩 성능에의 영향을 감소시키기 위해 선택되는 시그널링 그룹들로 함께 그룹화하는 단계를 더 포함하는, 인코딩 방법.
청구항 2에 있어서,
시작 코드, 종료 코드, 또는 길이 코드 중 적어도 하나를 정의하는 단계, 및 상기 인코딩 타입을 사용하여 상기 추가 정보에 인접한 비디오 신호 위치 내의 상기 시작 코드, 종료 코드, 또는 길이 코드 중 적어도 상기 하나를 나타내는 단계를 더 포함하는, 인코딩 방법.
청구항 5에 있어서,
상기 시작 코드 또는 종료 코드가 실제 비디오에서 일어나기 어려운 인코딩 결정 시퀀스를 나타내는, 인코딩 방법.
청구항 2에 있어서,
상기 추가 정보는 상기 비디오 신호의 내용과 연관되고, 상기 비디오 신호의 여러 부분과 시간적으로 동기화되는, 인코딩 방법.
삭제
청구항 3에 있어서,
유사한 성능을 가진 코딩 타입들을 결정하는 단계, 및 상기 사용하는 단계가 코딩 성능에 끼칠 영향을 감소시키는 그룹을 형성하기 위해 코딩 방법들을 그룹화하는 단계를 더 포함하는, 인코딩 방법.
삭제
삭제
청구항 1에 있어서,
상기 검출하는 단계는 상기 검출이 상기 비디오 신호 내의 변화에 기초하는 것을 포함하는, 인코딩 방법.
청구항 12에 있어서,
상기 무시하는 단계는 상기 추가 정보를 나타내는 데에 사용되는 내부-코딩 및 상호-코딩 사이에서 변화하는 단계를 포함하는, 인코딩 방법.
청구항 2에 있어서,
상기 비디오 신호 내의 상기 추가 정보의 종료 또는 시작 중 적어도 하나를 지시하기 위해 외부의 시그널링을 사용하는 단계를 더 포함하는, 인코딩 방법.
청구항 2에 있어서,
상기 추가 정보를 인코딩하기 위해 사용되는 상기 여러 인코딩 타입은 내부-대 상호-예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변경, 또는 양자화 파라메터를 포함하는, 인코딩 방법.
인코딩된 미디어 신호를 디코딩하는 단계;
상기 디코딩하는 단계로부터 추가 정보로서 정보의 비트를 획득하는 단계;
미디어 인코딩 타입과 상기 정보의 비트 사이의 관계에 접근하기 위해 모드 테이블을 사용하는 단계; 및
복수의 여러 인코딩 타입 중 하나로서 상기 미디어 신호를 인코딩하는 것에 사용된 인코딩 타입을 결정하는 단계를 포함하되,
상기 인코딩된 미디어 신호는,
상기 추가 정보와 상기 복수의 여러 인코딩 타입 사이의 매핑에 기반하여 상기 복수의 여러 인코딩 타입으로부터 하나의 인코딩 타입을 선택하는 단계; 및
상기 인코딩 타입이 상기 추가 정보를 표현하도록, 상기 선택된 인코딩 타입을 사용하여 상기 미디어 신호를 인코딩하는 단계의 수행에 의해 생성되며,
상기 미디어 신호를 인코딩하는 단계는, 상기 추가 정보에 기초하여 선택된 제1 인코딩 타입을 검출하는 단계와 상기 검출에 기초한 상기 선택을 무시하는 단계를 포함하고,
상기 제1 인코딩 타입은 비디오에서 저하(Degradation)를 일으키며,
상기 인코딩 타입을 무시하는 상기 단계는 상기 비디오의 다른 영역이 수신될 때까지 상기 추가 정보를 인코딩하는 것을 지연하는 단계를 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 16에 있어서,
상기 미디어 신호는 비디오 신호이고, 상기 미디어 인코딩 타입은 비디오 인코딩 모드를 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 17에 있어서,
상기 인코딩 타입은 상기 비디오 신호에 대한 복수의 예측 모드 중 적어도 하나를 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 18에 있어서,
상기 정보의 비트로부터 시작 코드 또는 종료 코드 중 적어도 하나를 결정하는 단계, 및 상기 시작 코드 또는 상기 종료 코드에 인접한 추가 정보를 검출하는 단계를 더 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 17에 있어서,
상기 비디오 신호의 여러 부분과 시간적으로 동기화된 대로 상기 추가 정보를 검출하는 단계를 더 포함하는, 미디어 신호를 디코딩하는 방법.
삭제
청구항 17에 있어서,
상기 인코딩 타입은 상기 추가 정보를 나타내는 데 사용되는 내부-코딩 및 상호-코딩을 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 17에 있어서,
상기 비디오 신호내의 상기 추가 정보의 시작 또는 종료 중 적어도 하나를 지시하는 외부 시그널링을 검출하는 단계를 더 포함하는, 미디어 신호를 디코딩하는 방법.
청구항 17에 있어서,
상기 추가 정보를 인코딩하는 데 사용되는 상기 여러 인코딩 타입은 내부-대 상호-예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변환, 또는 양자화 파라메터를 포함하는, 미디어 신호를 디코딩하는 방법.
미디어 신호를 복수의 여러 예측 모드들 중 하나로 인코딩하기 위해 동작하는 미디어 인코더;
상기 미디어 신호의 부분으로서 인코딩될 추가 정보에 대한 입력; 및
상기 복수의 여러 예측 모드들과 상기 추가 정보의 디지털 비트들 사이의 관계를 나타내는 모드 테이블에 접근하고, 상기 추가 정보에 기초하여 상기 복수의 여러 예측 모드들 중 하나를 선택하고 상기 선택된 예측 모드를 나타내기 위해 상기 추가 정보를 사용하는 결정부를 포함하되,
상기 결정부는, 상기 추가 정보에 기초하여 선택된 제1 인코딩 타입을 검출하고, 상기 검출에 기초한 상기 선택을 무시하며,
상기 제1 인코딩 타입은 비디오에서 저하(Degradation)를 일으키고,
상기 선택의 무시는 상기 비디오의 다른 영역이 수신될 때까지 상기 추가 정보를 인코딩하는 것을 지연하는, 미디어 신호를 인코딩하는 장치.
청구항 25에 있어서,
상기 미디어 신호는 비디오 신호인, 미디어 신호를 인코딩하는 장치.
청구항 25에 있어서,
상기 미디어 신호는 오디오 신호인, 미디어 신호를 인코딩하는 장치.
청구항 27에 있어서,
상기 미디어 인코더는 스피치 인코더인, 미디어 신호를 인코딩하는 장치.
청구항 25에 있어서,
상기 결정부는 예측 모드를 추가 정보의 비트에 연관시키는 예측 테이블을 포함하고, 상기 테이블은 예측 모드들을 코딩 성능에 대한 영향을 감소시키기 위해 선택되는 시그널링 그룹으로 함께 그룹화하는, 미디어 신호를 인코딩하는 장치.
청구항 25에 있어서,
상기 결정부는 코딩 성능에 대한 영향 때문에 고의로 상기 추가정보를 시그널링하지 않는, 미디어 신호를 인코딩하는 장치.
청구항 30에 있어서,
상기 추가 정보는 에러 정정 방법을 사용하여 사전에 인코딩된, 미디어 신호를 인코딩하는 장치.
청구항 26에 있어서,
시작 코드 또는 종료 코드 중 적어도 하나를 저장하고 상기 인코더 타입을 사용하여 상기 추가 정보에 인접한 비디오 신호 위치 내에 상기 시작 코드 또는 종료 코드 중 상기 적어도 하나를 나타내는 것을 더 포함하는, 미디어 신호를 인코딩하는 장치.
청구항 32에 있어서,
상기 시작 코드 또는 종료 코드는 실제 비디오에서 발생하기 어려운 인코딩 결정의 시퀀스를 나타내는, 미디어 신호를 인코딩하는 장치.
청구항 26에 있어서,
상기 추가 정보는 상기 비디오 신호의 내용과 연관되고, 상기 비디오 신호의 여러 부분과 시간적으로 동기화되는, 미디어 신호를 인코딩하는 장치.
삭제
청구항 26에 있어서,
상기 결정부는 유사한 성능을 가진 코딩 방법을 나타내는 정보와 상기 사용이 코딩 성능에 미칠 영향을 감소시키는 코딩 방법의 그룹을 포함하는, 미디어 신호를 인코딩하는 장치.
삭제
삭제
청구항 25에 있어서,
상기 비디오 인코더의 상기 무시 동작은 상기 추가 정보를 나타내는 데 사용되는 내부-코딩 및 상호-코딩 사이에서 변화하는 것을 포함하는, 미디어 신호를 인코딩하는 장치.
청구항 26에 있어서,
상기 비디오 신호 내의 상기 추가 정보의 시작 또는 종료 중 적어도 하나를 나타내는 외부의 시그널링으로의 연결을 더 포함하는, 미디어 신호를 인코딩하는 장치.
청구항 26에 있어서,
상기 추가 정보를 인코딩하는 데 사용되는 상기 여러 인코딩 타입은 내부-대 상호 예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변환, 또는 양자화 파라메터를 포함하는, 미디어 신호를 인코딩하는 장치.
인코딩된 미디어 신호를 디코딩하고 디코딩에 사용되었던 인코딩 타입을 결정하는 디코더로, 상기 미디어 신호를 디코딩했던 복수의 여러 인코딩 타입 중 하나를 결정하는 상기 디코더;
디코딩에서 추가 정보로서 정보의 비트를 출력하는 논리부(Logic Part)로, 상기 논리부는 비디오 인코딩 타입과 정보의 비트 사이의 관계에 접근하기 위하여 모드 테이블을 사용하되,
상기 인코딩된 미디어 신호는,
상기 추가 정보와 상기 복수의 여러 인코딩 타입 사이의 매핑에 기반하여 상기 복수의 여러 인코딩 타입으로부터 하나의 인코딩 타입을 선택하는 단계; 및
상기 인코딩 타입이 상기 추가 정보를 표현하도록, 상기 선택된 인코딩 타입을 사용하여 상기 미디어 신호를 인코딩하는 단계의 수행에 의해 인코딩되며,
상기 미디어 신호를 인코딩하는 단계는, 상기 추가 정보에 기초하여 선택된 제1 인코딩 타입을 검출하는 단계와 상기 검출에 기초한 상기 선택을 무시하는 단계를 포함하고,
상기 제1 인코딩 타입은 비디오에서 저하(Degradation)를 일으키며,
상기 인코딩 타입을 무시하는 상기 단계는 상기 비디오의 다른 영역이 수신될 때까지 상기 추가 정보를 인코딩하는 것을 지연하는 단계를 포함하는, 미디어 신호를 디코딩하는 장치.
청구항 42에 있어서,
상기 미디어 신호는 비디오 신호인, 미디어 신호를 디코딩하는 장치.
청구항 42에 있어서,
상기 미디어 신호는 오디오 신호인, 미디어 신호를 디코딩하는 장치.
청구항 44에 있어서,
상기 미디어 디코더는 스피치 디코더인, 미디어 신호를 디코딩하는 장치.
청구항 41에 있어서,
논리부는 미디어 신호에 대한 복수의 예측 모드와 상기 예측 모드에 연관된 비트를 저장하는, 미디어 신호를 인코딩하는 장치.
청구항 41에 있어서,
논리부는 또한 상기 정보의 비트로부터 시작 코드 또는 종료 코드 중 적어도 하나를 또한 검출하고, 상기 시작 코드 또는 상기 종료 코드에 인접한 상기 추가 정보를 검출하는, 미디어 신호를 인코딩하는 장치.
청구항 46에 있어서,
상기 논리부는 상기 미디어 신호에 포함된 상기 비트 정보에서 에러를 검출하고 정정하는, 미디어 신호를 인코딩하는 장치.
청구항 41에 있어서,
논리부는 상기 미디어 신호의 여러 부분과 시간적으로 동기화된 대로 상기 추가 정보를 검출하는, 미디어 신호를 인코딩하는 장치.
삭제
청구항 41에 있어서,
논리부는 상기 미디어 신호내의 상기 추가 정보의 시작과 종료 중 적어도 하나를 나타내는 외부의 시그널링을 검출하는, 미디어 신호를 인코딩하는 장치.
청구항 43에 있어서,
상기 추가 정보를 인코딩하기 위해 사용되는 상기 여러 인코딩 타입은 내부-대 상호 예측, 예측 방향, 하위 파티셔닝, 참조 인덱스, 움직임 및 조명 변화 파라메터, 변형, 또는 양자화 파라메터를 포함하는, 미디어 신호를 디코딩하는 장치.