KR101912485B1 - 타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 - Google Patents
타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR101912485B1 KR101912485B1 KR1020147000432A KR20147000432A KR101912485B1 KR 101912485 B1 KR101912485 B1 KR 101912485B1 KR 1020147000432 A KR1020147000432 A KR 1020147000432A KR 20147000432 A KR20147000432 A KR 20147000432A KR 101912485 B1 KR101912485 B1 KR 101912485B1
- Authority
- KR
- South Korea
- Prior art keywords
- picture
- tiles
- tile
- unit
- parameter
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명의 영상 부호화 스킴은 픽처를 타일 유닛이라 칭하는 소형 직사각형 유닛으로 분할하는 것을 지원한다. 각각의 타일 유닛은 각각 개별 부호화기 및 복호화기에 의해 독립적으로 부호화 및 복호화될 수 있다. 타일 유닛의 주 목적은 이행 비용 및 복잡성을 감소하는 것이다. 본 발명은 유연한 파티션된 타일 영역을 정의하고 타일 영역의 부분 복호화 및 재구성을 허용하도록 추가 기능성을 제공한다.
Description
본 발명은 임의의 멀티미디어 데이터 부호화에 이용될 수 있으며, 특히 픽처를 수개의 타일 영역으로 분할하는 화상 및 영상 부호화에 이용될 수 있다.
종래 기술의 당면한 HEVC(High-Efficiency Video Coding)와 같은 영상 부호화 스킴은 픽처를 타일 유닛이라 칭하는 소형 직사각형 유닛으로 분할하는 것을 지원한다. 각 타일 유닛은 별개의 부호화기 및 복호화기에 의해 각각 독립적으로 부호화 및 복호화될 수 있다. 타일 유닛의 주 목적은 이행 비용 및 복잡성을 감소시키기 위하여 픽처의 병렬 처리를 허용하는 것이다.
종래 기술에서의 픽처를 소형 타일로 분할하는 방법은 픽처를 수평으로 열로 절단하고, 다음으로 수직으로 행으로 절단하는 것이다. 이러한 픽처 분할 방법은 도 13에 도시된다. 픽처를 이러한 방식으로 분할함에 의해, 전체 열 폭을 전송하고 다음으로 전체 행 높이를 전송하는 것으로 픽처내의 타일 영역을 한정하는데 충분하다.
종래 기술에서 이용되는 타일 부호화 스킴에서, 타일 유닛은 개별적으로 부호화되고 타일들 사이의 공간 의존성은 제거될 수 있다. 그러나, 참조 픽처내의 타일 영역에 걸쳐 타일의 인터 예측이 수행될 수 있다.
픽처를 열 단위로 다음으로 행 단위로 타일로 분할하는 방법은 병렬 처리에 유용하나, 타일 부호화가 서브-픽처 영역을 한정하는데 이용되는 경우에는 유용하지 않다. 도 4는 픽처를 그 좌상 영역이 서브-픽처를 포함하는 최대 타일 영역인 3개의 영역으로 분할하는 방법을 도시한다. 종래 기술의 스킴의 문제점은 픽처가 4개의 영역으로 분할되어야 하고, 그 하부 타일 영역이 두개의 영역으로 분할될 필요가 있어서 하부 타일의 부호화 효율을 감소시킨다는 점이다.
종래 기술의 제2 문제점은 타일의 인터 예측이 참조 픽처내의 사전-정의된 타일 영역들에 걸쳐서 수행될 수 있다는 점이다. 따라서, 부호화 비트스트림으로부터 소형 해상도 픽처를 생성하기 위하여 픽처의 타일 영역 중 하나만을 복호화하는 것은 불가능하다.
이러한 문제점들을 해결하기 위하여, 픽처를 타일 유닛으로 분할하는 새로운 방법 및 타일 영역들에 걸친 움직임 예측을 제약하는 새로운 방법이 도입된다.
본 발명의 신규한 점은 본 발명은 픽처를 타일 영역으로 분할하는 보다 유연한 방법을 허용하고, 부호화 비트스트림으로부터 서브 비트스트림을 추출하는 새로운 기능을 제공하고, 소형 해상도 픽처를 생성하기 위하여 부호화 비트스트림의 부분 복호화를 수행하는 새로운 기능을 제공하는 것이다.
본 발명의 효과는 부호화 효율면에서의 개선 및 부분 비트스트림 복호화를 위한 새로운 기능의 추가에 있다.
도 1은 본 발명의 영상 부호화기를 위한 예시적 장치를 도시하는 블록도이다.
도 2는 본 발명의 서브 비트스트림 추출기 및 영상 복호화기를 위한 예시적 장치를 도시하는 블록도이다.
도 3은 본 발명의 서브 비트스트림 추출기 및 영상 복호화기를 위한 예시적 장치를 도시하는 블록도이다.
도 4는 픽처를 각 영영에 대해 상이한 폭 및 높이를 갖는 3개의 타일 영역으로 분할하는 예를 도시하는 도면이다.
도 5a는 압축된 영상 스트림내의 픽처 파라미터 셋내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 5b는 압축된 영상 스트림내의 슬라이스 공통 파라미터내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 5c는 압축된 영상 스트림내의 순서 파라미터 셋내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 6은 압축된 영상 스트림내의 SEI(보충적 인핸스먼트 정보) 메시지내의 각 타일 유닛에 대한 움직임 예측 제약 타일 플래그의 위치를 도시하는 도면이다.
도 7은 본 발명의 제1 실시예를 이용하는 영상 부호화 처리를 도시하는 흐름도이다.
도 8은 움직임 예측이 본 발명의 제2 실시예의 참조 픽처내의 동일한 타일 영역에 제약됨을 도시하는 도면이다.
도 9는 본 발명의 제2 실시예를 이용하는 영상 부호화 처리를 도시하는 흐름도이다.
도 10은 본 발명의 제3 실시예를 이용하는 영상 복호화 처리를 도시하는 흐름도이다.
도 11은 본 발명의 제4 실시예를 이용하는 영상 추출 처리를 도시하는 흐름도이다.
도 12는 본 발명의 제5 실시예를 이용하는 영상 복호화 처리를 도시하는 흐름도이다.
도 13은 픽처를 종래 기술에서 설명된 타일 영역으로 분할하는 예를 도시하는 도면이다.
도 14는 컨텐츠 배송 서비스를 실현하는 콘텐츠 공급 시스템의 전체 구성도이다.
도 15는 디지털 방송 시스템의 전체 구성도이다.
도 16은 텔레비전의 구성 예를 나타내는 블록도이다.
도 17은 광디스크인 기록 매체에 정보의 읽기 쓰기를 행하는 정보 재생/기록부의 구성 예를 나타내는 블록도이다.
도 18은 광디스크인 기록 매체의 구조 예를 나타내는 도면이다.
도 19A는 휴대 전화의 일례를 나타내는 도면이다.
도 19B는 휴대 전화의 구성 예를 나타내는 블록도이다.
도 20은 다중화 데이터의 구성을 나타내는 도면이다.
도 21은 각 스트림이 다중화 데이터에서 어떻게 다중화되어 있는지를 모식적으로 나타내는 도면이다.
도 22는 PES 패킷 열에 영상 스트림이 어떻게 저장되는지를 더욱 상세하게 나타낸 도면이다.
도 23은 다중화 데이터에 있어서의 TS 패킷과 소스 패킷의 구조를 나타내는 도면이다.
도 24는 PMT의 데이터 구성을 나타내는 도면이다.
도 25는 다중화 데이터 정보의 내부 구성을 나타내는 도면이다.
도 26은 스트림 속성 정보의 내부 구성을 나타내는 도면이다.
도 27은 영상 데이터를 식별하는 단계를 나타내는 도면이다.
도 28은 각 실시 형태의 동화상 부호화 방법 및 동화상 복호화 방법을 실현하는 집적 회로의 구성 예를 나타내는 블록도이다.
도 29는 구동 주파수를 전환하는 구성을 나타내는 도면이다.
도 30은 영상 데이터를 식별하고 구동 주파수를 전환하는 단계를 나타내는 도면이다.
도 31은 영상 데이터의 규격과 구동 주파수를 대응시킨 룩업 테이블의 일례를 나타내는 도면이다.
도 32A는 신호 처리부의 모듈을 공유화하는 구성의 일례를 나타내는 도면이다.
도 32B는 신호 처리부의 모듈을 공유화하는 구성의 다른 일례를 나타내는 도면이다.
도 2는 본 발명의 서브 비트스트림 추출기 및 영상 복호화기를 위한 예시적 장치를 도시하는 블록도이다.
도 3은 본 발명의 서브 비트스트림 추출기 및 영상 복호화기를 위한 예시적 장치를 도시하는 블록도이다.
도 4는 픽처를 각 영영에 대해 상이한 폭 및 높이를 갖는 3개의 타일 영역으로 분할하는 예를 도시하는 도면이다.
도 5a는 압축된 영상 스트림내의 픽처 파라미터 셋내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 5b는 압축된 영상 스트림내의 슬라이스 공통 파라미터내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 5c는 압축된 영상 스트림내의 순서 파라미터 셋내의 각 타일 유닛에 대한 타일 폭 및 타일 높이의 위치를 도시하는 도면이다.
도 6은 압축된 영상 스트림내의 SEI(보충적 인핸스먼트 정보) 메시지내의 각 타일 유닛에 대한 움직임 예측 제약 타일 플래그의 위치를 도시하는 도면이다.
도 7은 본 발명의 제1 실시예를 이용하는 영상 부호화 처리를 도시하는 흐름도이다.
도 8은 움직임 예측이 본 발명의 제2 실시예의 참조 픽처내의 동일한 타일 영역에 제약됨을 도시하는 도면이다.
도 9는 본 발명의 제2 실시예를 이용하는 영상 부호화 처리를 도시하는 흐름도이다.
도 10은 본 발명의 제3 실시예를 이용하는 영상 복호화 처리를 도시하는 흐름도이다.
도 11은 본 발명의 제4 실시예를 이용하는 영상 추출 처리를 도시하는 흐름도이다.
도 12는 본 발명의 제5 실시예를 이용하는 영상 복호화 처리를 도시하는 흐름도이다.
도 13은 픽처를 종래 기술에서 설명된 타일 영역으로 분할하는 예를 도시하는 도면이다.
도 14는 컨텐츠 배송 서비스를 실현하는 콘텐츠 공급 시스템의 전체 구성도이다.
도 15는 디지털 방송 시스템의 전체 구성도이다.
도 16은 텔레비전의 구성 예를 나타내는 블록도이다.
도 17은 광디스크인 기록 매체에 정보의 읽기 쓰기를 행하는 정보 재생/기록부의 구성 예를 나타내는 블록도이다.
도 18은 광디스크인 기록 매체의 구조 예를 나타내는 도면이다.
도 19A는 휴대 전화의 일례를 나타내는 도면이다.
도 19B는 휴대 전화의 구성 예를 나타내는 블록도이다.
도 20은 다중화 데이터의 구성을 나타내는 도면이다.
도 21은 각 스트림이 다중화 데이터에서 어떻게 다중화되어 있는지를 모식적으로 나타내는 도면이다.
도 22는 PES 패킷 열에 영상 스트림이 어떻게 저장되는지를 더욱 상세하게 나타낸 도면이다.
도 23은 다중화 데이터에 있어서의 TS 패킷과 소스 패킷의 구조를 나타내는 도면이다.
도 24는 PMT의 데이터 구성을 나타내는 도면이다.
도 25는 다중화 데이터 정보의 내부 구성을 나타내는 도면이다.
도 26은 스트림 속성 정보의 내부 구성을 나타내는 도면이다.
도 27은 영상 데이터를 식별하는 단계를 나타내는 도면이다.
도 28은 각 실시 형태의 동화상 부호화 방법 및 동화상 복호화 방법을 실현하는 집적 회로의 구성 예를 나타내는 블록도이다.
도 29는 구동 주파수를 전환하는 구성을 나타내는 도면이다.
도 30은 영상 데이터를 식별하고 구동 주파수를 전환하는 단계를 나타내는 도면이다.
도 31은 영상 데이터의 규격과 구동 주파수를 대응시킨 룩업 테이블의 일례를 나타내는 도면이다.
도 32A는 신호 처리부의 모듈을 공유화하는 구성의 일례를 나타내는 도면이다.
도 32B는 신호 처리부의 모듈을 공유화하는 구성의 다른 일례를 나타내는 도면이다.
[실시 형태 1]
실시 형태 (I & II): 영상 부호화기 블록도:
도 1은 본 발명의 실시예에서의 영상/화상 부호화 장치의 구조를 도시하는 블록도이다.
영상 부호화 장치는 부호화 출력 비트 스트림을 생성하도록 블록 단위로 입력 영상/화상 비트 스트림을 부호화하기 위한 장치이다. 도 1에 도시된 것처럼, 장치는 변환부(101), 양자화부(102), 역양자화부(103), 역변환부(104), 블록 메모리(105), 프레임 메모리(106), 인트라 예측부(107), 인터 예측부(108), 엔트로피 부호화부(109), 타일 분할부(110) 및 기록부(111)를 포함한다.
입력 영상은 타일 분할부(110)에 입력되고, 후자는 스캔된 픽셀의 블록을 타일 유닛 단위로 가산기에 출력한다. 타일 분할부(110)는 또한 타일 영역에 걸친 움직임 예측을 디스에이블시키기 위하여 타일 영역의 체적 및 플래그를 기록부(111)에 출력한다. 기록부(111)는 다음으로 입력된 파라미터를 비트 스트림의 헤더로 출력한다.
픽셀 블록이 가산기에 출력된 이후에, 가산된 값의 블록을 변환부(101)로 출력한다. 변환부(101)는 가산된 값을 주파수 계수로 변환하고, 그 결과의 주파수 계수를 양자화 유닛(102)에 출력한다. 양자화 유닛(102)은 입력된 주파수 계수를 양자화하고, 그 결과의 양자화된 값을 역양자화부(103) 및 엔트로피 부호화부(109)로 출력한다. 엔트로피 부호화부(109)는 양자화부(102)로부터 출력된 양자화된 값을 부호화하고, 비트 스트림을 출력한다.
역양자화부(103)는 양자화부(102)로부터 출력된 샘플값을 역양자화하고, 주파수 계수를 역변환부(104)로 출력한다. 역변환부(104)는 주파수 계수를 비트스트림의 샘플값으로 변환하도록 주파수 계수에 대해 역주파수 변환을 수행하고, 가산기로 출력한다. 가산기는 역변환부(104)로부터 출력된 비트 스트림의 샘플값을 인터/인트라 예측부(107, 108)로부터 출력된 예측된 영상/화상값에 가산하고, 그 결과의 가산된 값을 추가 예측을 위하여 블록 메모리(105) 또는 프레임 메모리(106)에 출력한다. 인터/인트라 예측부(107, 108)는 블록 메모리(105) 또는 프레임 메모리(106)내에 저장된 재구성된 영상/화상내에서 검색을 하고, 예를 들면 예측을 위하여 입력 영상/화상에 가장 유사한 영상/화상 영역을 추정한다.
실시예 (I): 구문
도 5a 내지 도 5c는 본 발명의 예시적 실시예에서의 각 타일 유닛에 대한 타일 파라미터의 위치를 보여주는 구문 해석도이다.
도 5a에서, 타일 파라미터는 픽처 파라미터 셋내에 위치될 수 있다. 픽처 파라미터 셋내의 타일 파라미터는 타일 개수에 대한 파라미터 및 각 타일 유닛에 대한 타일 파라미터로 구성된다. 각 타일 유닛에 대한 타일 파라미터는 각 타일 유닛에 대한 타일 영역의 체적을 규정하는 타일 폭 및 타일 높이로 구성된다.
도 5b에서, 타일 파라미터는 슬라이스 공통 파라미터 셋내에 위치될 수 있다. 슬라이스 공통 파라미터 셋에 대한 다른 가능한 명칭은 복수개의 슬라이스가 파라미터 셋내의 동일한 파라미터를 이용하는 적응 파라미터 셋이다. 슬라이스 적응 파라미터 셋내의 타일 파라미터는 타일 개수에 대한 파라미터와 각 타일 유닛에 대한 타일 파라미터로 구성된다. 각 타일 유닛에 대한 타일 파라미터는 각 타일 유닛에 대한 타일 영역의 체적을 규정하는 타일 폭 및 타일 높이로 구성된다.
도 5c에서, 타일 파라미터는 순서 파라미터 셋내에 위치될 수 있다. 순서 파라미터 셋 내의 타일 파라미터는 타일의 개수에 대한 파라미터와 각 타일 유닛에 대한 타일 파라미터로 구성된다. 각 타일 유닛에 대한 타일 파라미터는 각 타일 유닛에 대한 타일 영역의 체적을 규정하는 타일 폭 및 타일 높이로 구성된다.
다음으로, 상술한 것처럼 영상 부호화 장치(100)의 동작에 대해 설명된다.
실시예 (I): 부호화 흐름도:
도 7은 본 발명의 제1 실시예에서의 영상/화상 부호화 장치(100)의 부호화 방법/단계에 대한 동작의 순서를 도시하는 흐름도(S700)이다.
단계 S702에서, 화상은 복수개의 타일 영역으로 분할된다. 단계 S704에서, 타일 영역의 수를 나타내는 파라미터가 영상 스트림의 헤더로 기록된다. 다음으로, 단계 S706에서, 각 타일 영역에 대한 폭 파라미터 및 높이 파라미터가 영상 스트림의 헤더에 기록된다. 단계 S708에서 각 타일 영역은 다른 타일 영역과의 공간 의존성 없이 독립적으로 부호화된다. 마지막으로 단계 S710에서, 복수개의 부호화된 타일 유닛은 픽처내의 타일 영역들의 래스터 스캔 순서를 기초로 한 순서대로 영상 스트림내에 기록된다.
본 발명의 효과는 화상을 타일 영역으로 분할하는데 있어서의 보다 우수한 유연성의 형태에 있다. 본 발명을 이용하여, 각 타일 영역의 체적을 개별적으로 시그널링하는 방식으로 화상은 보다 유연하게 타일 영역으로 분할될 수 있다. 본 발명은 타일 영역을 한정하는 보다 유연한 방식을 제공하여, 불필요하게 타일 영역을 한정함에 의해 야기되는 오버헤드를 감소시킨다.
실시예(II): 구문
도 6은 본 발명의 실시예에서의 각 타일 유닛에 대한 움직임 예측을 제약하기 위한 플래그의 위치를 보이는 구문 해석도이다.
도 6에서, 타일 파라미터는 보충적 인핸스먼트 정보 메시지내에 위치된다. 보충적 인핸스먼트 정보 메시지내의 타일 파라미터는 픽처내의 타일 영역의 개수에 대한 파라미터 및 각 타일 영역과 관련된 파라미터로 구성된다. 각 타일 영역에 대한 타일 파라미터는 타일 영역에 걸친 움직임 예측에 대한 제약을 인에이블 또는 디스에이블하기 위한 스위치를 나타내는 플래그로 구성된다.
도 8은 움직임 예측을 참조 픽처에서의 동일한 타일 영역으로 제약하는 도식의 예를 도시한다. 움직임 예측은 참조 픽처내의 동일한 타일 영역내의 샘플만이 예측에 이용될 수 있는 방식으로 제약된다.
다음으로, 상술한 영상 부호화 장치(100)의 동작에 대해 설명된다.
실시예(II): 부호화 흐름도:
도 9는 본 발명의 제2 실시예에서의 영상/화상 부호화 장치(100)의 부호화 방법/단계를 위한 동작의 순서를 보여주는 흐름도(S900)이다.
단계 S902에서, 화상은 복수개의 타일 영역으로 분할된다. 단계 S904에서, 타일 영역의 개수를 나타내는 파라미터는 영상 스트림의 헤더에 기록된다. 유사하게, 단계 S906에서, 움직임 예측에 제약이 가해진지 여부를 나타내는 각 타일 영역에 대한 플래그가 영상 스트림의 헤더에 기록된다.
단계 S906에서, 각 플래그가 소정값을 갖는지 결정하기 위하여 판정된다. 플래그가 소정값을 갖는 것으로 판정되는 경우, 타일 영역은 단계 S908에서 참조 픽처내의 동일 타일 영역으로부터 예측을 하기 위하여 움직임 예측에 대한 제약으로 부호화된다. 다르게는, 단계 S910에서, 타일 영역은 참조 픽처내의 동일 타일 영역내에 머무르도록 움직임 예측에 대한 제약 없이 부호화된다.
본 발명의 효과는 상이한 타일 영역들에 걸친 시간적 의존성 없이 타일 영역을 부호화하는 기능성을 제공하는 형태에 있다. 그러므로, 본 발명은 영상 스트림이, 픽처의 영역이 전체 영상 스트림의 복호화 없이 복호화 및 재구성될 수 있도록 하는 구조가 되도록 한다. 부분적으로 재구성된 영상은 전체 해상도 영상과 동일한 프레임 속도를 갖는 소형 해상도 영상이다.
실시예 (III, IV & V): 복호화기 블록도
도 2는 본 발명의 실시예에서의 영상 복호화 장치(200)의 구조를 도시하는 블록도이다.
영상 복호화 장치(200)는 블럭 단위로 입력 부호화 비트 스트림을 복호화하고 영상/화상을 출력하기 위한 장치로서, 도 2에 도시된 것처럼 엔트로피 복호화부(201), 역양자화부(202), 역변환부(203), 블록 메모리(204), 프레임 메모리(205), 인트라 예측부(206), 인터 예측부(207) 및 서브 비트 스트림 추출부(208)를 포함한다. 본 발명의 다른 가능한 실시예에서, 서브 비트 스트림 추출부(208)는 영상 복호화 장치와는 다른 개별 장치이다.
입력 부호화 비트 스트림은 서브 비트 스트림 추출부(208)로 입력되고, 서브 비트 스트림을 출력한다. 서브 비트 스트림은 다음으로 엔트로피 복호화부(201)로 입력된다.
입력 부호화 비트 스트림이 엔트로피 복호화부(201)로 입력된 이후에, 엔트로피 복호화부(201)는 입력 부호화 비트 스트림을 복호화하고, 복호화된 값을 역양자화부(202)로 출력한다. 역양자화부(202)는 복호화된 값을 역으로 양자화하고, 주파수 계수를 역변환부(203)로 출력한다. 역변환부(203)는 주파수 계수를 샘플값으로 변환하기 위하여 주파수 계수에 대한 역주파수 변환을 수행하고, 결과 픽셀값을 가산기에 출력한다. 가산기는 결과 픽셀값을 인트라/인터 예측부(206, 207)로부터 출력된 예측된 영상/화상값에 가산하고, 그 결과값을 추가 예측을 위하여 블록 메모리(204) 또는 프레임 메모리(205)로 출력한다. 또한, 인트라/인터 예측부(206, 207)는 블록 메모리(204) 또는 프레임 메모리(205)내에 저장된 영상/화상내에서 검색하고, 예를 들면 예측을 위한 복호화된 영상/화상과 가장 유사한 영상/화상 영역을 추정한다.
도 3은 본 발명의 실시예에서의 서브 비트 스트림 추출부(208)의 구조를 도시하는 블록도이다.
서브 비트 스트림 추출부(208)는 입력 비트 스트림으로부터 서브 비트 스트림을 추출하기 위한 장치이며, 도 3에 도시된 것처럼, 추출부(301), 파싱부(303) 및 선택적 헤더 재기록부(302)를 포함한다.
입력 부호화 비트 스트림은 파싱부(303)로 입력되고, 타일 영역의 체적 및 움직임 예측에 대한 제약을 표시하는 플래그를 포함하는 파라미터를 추출부(301)에 출력한다. 입력 부호화 비트 스트림 및 파싱된 파라미터는 추출부(301)에 입력되고, 비트 스트림의 일부가 출력된다. 부분 비트 스트림 및 파싱된 파라미터는 다음으로 선택적 헤더 재기록부(302)로 입력되고, 헤더내의 개조된 파라미터를 포함하는 비트 스트림이 출력된다.
다음으로, 상술한 것처럼 영상 복호화 장치(200)의 동작에 대해 설명된다.
실시예(III): 복호화 흐름도:
도 10은 본 발명의 제3 실시예에서의 영상/화상 복호화 장치(200)의 복호화 방법/단계에 대한 동작의 순서를 도시하는 흐름도(S1000)이다.
단계 S1002에서, 픽처를 위한 폭 파라미터 및 높이 파라미터가 영상 스트림의 헤더로부터 파싱된다. 픽처 폭 및 높이 파라미터는 순서 파라미터 셋내에 위치될 수 있다. 단계 S1004에서, 픽처내의 타일 영역의 개수를 나타내는 파라미터가 영상 스트림의 헤더로부터 파싱된다. 다음으로, 단계 S1006에서, 각 타일 영역에 대한 폭 파라미터 및 높이 파라미터가 영상 스트림의 헤더로부터 파싱된다. 단계 S1008에서, 타일 영역내의 블록은 상이한 타일 영역내의 블록과의 공간 의존성 없이 독립적으로 복호화되고 재구성된다. 마지막으로 단계 S1010에서, 재구성된 타일 영역을 그들의 파싱된 폭 및 높이 파라미터 및 파싱된 픽처 폭 및 파싱된 픽처 높이에 의해 한정된 특정 위치에 배치시킴에 의해 복호화된 타일을 기초로 픽처는 재구성된다. 재구성된 타일은 픽처 폭 및 픽처 높이에 의해 한정된 직사각형 영역을 채우기 위하여 래스터 스캔 순서로 배치된다.
본 발명의 효과는 픽처의 병렬 처리를 허용함에 의해 복잡성을 감소시키는 형태에 있다. 본 발명을 이용하여, 상이한 직사각형 체적을 갖는 타일은 병렬 처리를 이용하여 복호화될 수 있고, 픽처는 픽처 폭 및 높이에 의해 한정되는 픽처 영역을 채우기 위하여 래스터 스캔 순서로 타일을 재배치함에 의해 재생성될 수 있다.
실시예 (IV): 복호화 흐름도:
도 11은 본 발명의 제4 실시예에서의 영상/화상 복호화 장치(200)의 복호화 방법/단계를 위한 동작의 순서를 도시하는 흐름도(S1100)이다.
단계 S1102에서, 타일 영역을 위한 폭 파라미터 및 높이 파라미터는 영상 스트림의 헤더로부터 파싱된다. 단계 S1104에서, 움직임 예측이 타일 영역에 대해 제약되는지 여부에 대한 결정을 나타내는 플래그 파라미터가 영상 스트림의 헤더로부터 파싱된다. 다음으로 단계 S1106에서, 파싱된 플래그가 소정값을 갖는지 여부를 결정하도록 판정된다. 파싱된 플래그가 소정값을 갖는 것으로 판정되는 경우 선택적 단계 S1108에서, 픽처 폭 파라미터 및 픽처 높이 파라미터는 파싱된 타일 영역 폭 및 타일 영역 높이 파라미터로 대체되고, 영상 스트림의 헤더에 재기록된다. 픽처 폭 및 높이 파라미터는 영상 스트림의 순서 파라미터 셋내에 위치된다. 마지막으로, 단계 S1110에서, 파싱된 플래그가 소정값을 갖는 것으로 판정되는 경우, 부호화된 타일 유닛은 개조된 헤더를 갖는 신규 영상 스트림을 생성하도록 영상 스트림으로부터 추출된다.
본 발명의 효과는 서브 영상 스트림이 입력된 영상 스트림의 복호화 없이 영상 스트림으로부터 추출되도록 허용하기 위한 새로운 기능성을 추가하는 형태이며, 추출된 영상 스트림은 본 발명의 영상 복호화기에 의해 복호화되고 재구성될 수 있다.
실시예 (V): 복호화 흐름도:
도 12는 본 발명의 제5 실시예에서의 영상/화상 복호화 장치(200)의 복호화 방법/단계를 위한 동작의 순서를 도시하는 흐름도(S1200)이다.
단계 S1202에서, 타일 영역에 대한 폭 파라미터 및 높이 파라미터는 영상 스트림의 헤더로부터 파싱된다. 단계 S1204에서, 움직임 예측이 타일 영역에 대해 제약되는지 여부의 결정을 나타내는 플래그 파라미터가 영상 스트림의 헤더로부터 파싱된다. 다음으로 단계 S1206에서, 파싱된 플래그가 소정값을 가지는지를 결정하기 위하여 판정이 수행된다. 파싱된 플래그가 소정값을 가지는 것으로 판정되는 경우, 단계 S1208에서, 타일 유닛은 인터 픽처 예측을 이용하여 부분적으로 재구성된 참조 픽처로 복호화되고, 재구성된 픽처의 일부는 단계 S1210에서 복호화된 타일 영역만을 포함하는 것으로 디스플레이된다.
단계 S1206으로 돌아가서, 파싱된 플래그가 소정값을 가지지 않는 것으로 판정되면, 단계 S1212에서, 타일 유닛은 인터 픽처 예측을 이용하여 완전 재구성 참조 픽처로 복호화되고, 다음으로 단계 S1214에서 픽처에 속하는 전체 복호화된 타일 유닛을 포함하는 픽처의 디스플레이가 잇따른다. 본 발명의 다른 가능한 실시예에서, 단계 S1206으로 복귀하여, 파싱된 플래그가 소정값을 가지지 않는 것으로 판정되는 경우, 단계 S1212 및 단계 S1214는 스킵되고, 타일 유닛은 복호화되지 않을 것이다.
본 발명의 효과는 영상 복호화기가 복잡성을 감소하거나 또는 나머지 영역들의 복호화를 필요로 하지 않고 픽처의 영역만을 디스플레이하도록 영상 스트림의 부분적 복호화를 수행하도록 허용하는 추가적 복호화 유연성의 형태에 있다.
[실시 형태 2]
상기 각 실시 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 또는 동화상 복호화 방법(화상 복호 방법)의 구성을 실현하기 위한 프로그램을 기억 매체에 기록함으로써 상기 각 실시 형태에서 나타낸 처리를 독립한 컴퓨터 시스템에 있어서 간단히 실시할 수 있게 된다. 기록 매체는 자기 디스크, 광 디스크, 광 자기 디스크, IC 카드, 반도체 메모리 등 프로그램을 기록할 수 있는 것이면 된다.
또한 여기에서, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법(화상 부호화 방법) 및 동화상 복호화 방법(화상 복호 방법)의 응용예와 이를 이용한 시스템을 설명한다. 해당 시스템은 화상 부호화 방법을 이용한 화상 부호화 장치 및 화상 복호 방법을 이용한 화상 복호화 장치로 이루어진 화상 부호화 복호화 장치를 갖는 것을 특징으로 한다. 시스템에 있어서의 다른 구성에 대해, 경우에 따라 적절하게 변경할 수 있다.
도 14는 콘텐츠 배송 서비스를 실현하는 콘텐츠 공급 시스템(ex100)의 전체 구성을 나타내는 도면이다. 통신 서비스의 제공 영역을 원하는 크기로 분할하고, 각 셀에 각각 고정 무선국인 기지국(ex106, ex107, ex108, ex109, ex110)이 설치되어 있다.
이 콘텐츠 공급 시스템(ex100)은 인터넷(ex101)에 인터넷 서비스 프로바이더(ex102) 및 전화망(ex104) 및 기지국(ex106 내지 ex110)을 통해 컴퓨터(ex111), PDA(Personal Digital Assistant)(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등의 각 기기가 접속된다.
그러나, 컨텐츠 공급 시스템(ex100)은 도 14와 같은 구성에 한정되지 않고 어떤 요소를 조합하여 접속하도록 해도 된다. 또한, 고정 무선국인 기지국(ex106 내지 ex110)을 통하지 않고, 각 기기가 전화망(ex104)에 직접 접속되어도 된다. 또한, 각 기기가 근거리 무선 등을 통해 서로 직접 연결되어 있어도 된다.
카메라(ex113)는 디지털 비디오 카메라 등의 동화상 촬영이 가능한 기기이며, 카메라(ex116)는 디지털 카메라 등의 정지 화상 촬영, 동화상 촬영이 가능한 기기이다. 또한, 휴대 전화(ex114)는 GSM(등록 상표)(Global System for Mobile Communications) 방식, CDMA(Code Division Multiple Access) 방식, W-CDMA(Wideband-Code Division Multiple Access) 방식, 또는 LTE(Long Term Evolution) 방식, HSPA(High Speed Packet Access) 휴대 전화 또는 PHS(Personal Handyphone System) 등이며, 어느 것이라도 상관 없다.
콘텐츠 공급 시스템(ex100)에서는 카메라(ex113) 등이 기지국(ex109), 전화망(ex104)을 통해 스트리밍 서버(ex103)에 접속됨으로써, 라이브 배송 등이 가능하게 된다. 라이브 배송에서는, 사용자가 카메라(ex113)를 이용하여 촬영하는 컨텐츠(예컨대, 음악 라이브의 영상 등)에 대해 상기 각 실시 형태에서 설명한 바와 같이 부호화 처리를 행하는(즉, 본 발명의 일 양태에 따른 화상 부호화 장치로서 기능하는) 스트리밍 서버(ex103)에 송신한다. 한편, 스트리밍 서버(ex103)는 요구한 클라이언트에 대해 전송된 콘텐츠 데이터를 스트림 배송한다. 클라이언트로서는 상기 부호화 처리된 데이터를 복호화할 수 있는 컴퓨터(ex111), PDA(ex112), 카메라(ex113), 휴대 전화(ex114), 게임기(ex115) 등이 있다. 배송된 데이터를 수신한 각 기기에서는 수신된 데이터를 복호화 처리하여 재생한다(즉, 본 발명의 일 실시 형태에 따른 화상 복호 장치로서 기능한다).
또한, 촬영한 데이터의 부호화 처리는 카메라(ex113)로 행해도, 데이터의 송신 처리를 하는 스트리밍 서버(ex103)로 행해도 되고, 서로 분담하여 행해도 된다. 마찬가지로, 배송된 데이터의 복호화 처리는 클라이언트에서 행해도, 스트리밍 서버(ex103)에서 행해도 되고, 서로 분담하여 행해도 된다. 또한, 카메라(ex113)에 한정하지 않고, 카메라(ex116)로 촬영한 정지 화상 및/또는 동화상 데이터를 컴퓨터(ex111)를 통해 스트리밍 서버(ex103)에 송신해도 된다. 이 경우의 부호화 처리는 카메라(ex116), 컴퓨터(ex111), 스트리밍 서버(ex103) 중 어느 것으로 행해도 되고, 서로 분담하여 행해도 된다.
또한, 이러한 부호화·복호화 처리는 일반적으로 컴퓨터(ex111)나 각 기기가 갖는 LSI(ex500)에서 처리한다. LSI(ex500)는 원칩이어도 복수 칩으로 이루어진 구성이어도 된다. 또한, 동화상 부호화·복호화용의 소프트웨어를 컴퓨터(ex111) 등으로 판독 가능한 어떠한 기록 매체(CD-ROM, 플렉시블 디스크, 하드 디스크 등)에 내장하고, 그 소프트웨어를 이용하여 부호화·복호화 처리를 행해도 된다. 또한, 휴대 전화(ex114)가 카메라부착 가능한 경우에는, 그 카메라로 취득한 동화상 데이터를 송신해도 된다. 이 때의 동화상 데이터는 휴대 전화(ex114)가 갖는 LSI(ex500)로 부호화 처리된 데이터이다.
또한, 스트리밍 서버(ex103)는 복수의 서버나 복수의 컴퓨터로서, 데이터를 분산하여 처리하거나 기록하거나 배송하는 것이어도 된다.
이상과 같이 하여, 콘텐츠 공급 시스템(ex100)에서는 부호화된 데이터를 클라이언트가 수신하여 재생할 수 있다. 이와 같이 콘텐츠 공급 시스템(ex100)에서는 사용자가 송신한 정보를 실시간으로 클라이언트가 수신하여 복호화하고 재생할 수 있으며, 특별한 권리와 시설을 갖지 않는 사용자로도 개인 방송을 실현할 수 있다.
또한, 콘텐츠 공급 시스템(ex100)의 예에 한정하지 않고, 도 15에 나타내는 바와 같이 디지털 방송용 시스템(ex200)에도 상기 각 실시 형태의 적어도 동화상 부호화 장치(화상 부호화 장치) 또는 동화상 복호화 장치(화상 복호 장치) 중 어느 하나를 포함할 수 있다. 구체적으로는, 방송국(ex201)에서는 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터가 전파를 통해 통신 또는 위성(ex202)에 전송된다. 이 영상 데이터는 상기 각 실시 형태에서 설명한 동화상 부호화 방법에 의해 부호화된 데이터이다(즉, 본 발명의 일 실시 형태에 따른 화상 부호화 장치에 의해 부호화된 데이터이다). 이것을 수신한 방송 위성(ex202)은 방송용 전파를 발신하고, 이 전파를 위성 방송 수신이 가능한 가정의 안테나(ex204)가 수신한다. 수신한 다중화 데이터를 텔레비전(수신기)(ex300) 또는 셋톱 박스(STB)(ex217) 등의 장치가 복호화하여 재생한다(즉, 본 발명의 일 실시 형태에 따른 화상 복호 장치로서 기능한다).
또한, DVD BD 등의 기록 매체(ex215)에 기록한 다중화 데이터를 판독하여 복호화하거나, 또는 기록 매체(ex215)에 영상 신호를 부호화하고, 또한 경우에 따라서는 음악 신호와 다중화하여 기록하는 리더/레코더(ex218)에도 상기 각 실시 형태에서 나타낸 동화상 복호화 장치 또는 동화상 부호화 장치를 실장하는 것이 가능 하다. 이 경우, 재생된 영상 신호는 모니터(ex219)에 표시되고, 다중화 데이터가 기록된 기록 매체(ex215)에 의해 다른 장치나 시스템에서 영상 신호를 재생할 수 있다. 또한, 케이블 텔레비전용의 케이블(ex203) 또는 위성/지상파 방송의 안테나(ex204)에 접속된 셋톱 박스(ex217) 내에 동화상 복호화 장치를 실장하고, 이를 텔레비전의 모니터(ex219)로 표시해도 된다. 이 때 셋탑 박스가 아니라, 텔레비전 내에 동화상 복호화 장치를 포함해도 된다.
도 16은 상기 각 실시 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 텔레비전(수신기)(ex300)을 나타내는 도면이다. 텔레비전(ex300)은 상기 방송을 수신하는 안테나(ex204) 또는 케이블(ex203) 등을 통해 영상 데이터에 음성 데이터가 다중화된 다중화 데이터를 취득 또는 출력하는 튜너(ex301)와, 수신한 다중화 데이터를 복조하거나, 또는 외부에 송신하는 다중화 데이터로 변조하는 변조/복조부(ex302)와, 복조한 다중화 데이터를 영상 데이터와 음성 데이터로 분리하거나, 또는 신호 처리부(ex306)에서 부호화된 영상 데이터, 음성 데이터를 다중화하는 다중화/역다중화부(ex303)를 구비한다.
또한, 텔레비전(ex300)은 음성 데이터, 영상 데이터 각각을 복호화하거나, 또는 각각의 정보를 부호화하는 음성 신호 처리부(ex304), 영상 신호 처리부(ex305)(본 발명의 일 실시 형태에 따른 화상 부호화 장치 또는 화상 복호 장치로서 기능함)를 갖는 신호 처리부(ex306)와, 복호화한 음성 신호를 출력하는 스피커(ex307), 복호화된 영상 신호를 표시하는 디스플레이 등의 표시부(ex308)를 갖는 출력부(ex309)를 갖는다. 또한, 텔레비전(ex300)은 사용자 조작의 입력을 접수하는 조작 입력부(ex312) 등을 가지는 인터페이스부(ex317)를 갖는다. 또한, 텔레비전(ex300)은 각부를 총괄적으로 제어하는 제어부(ex310), 각 부에 전원을 공급하는 전원 회로부(ex311)를 갖는다. 인터페이스부(ex317)는 조작 입력부(ex312) 이외에 리더/레코더(ex218) 등의 외부 기기와 접속되는 브릿지(ex313), SD 카드 등의 기록 매체(ex216)를 장착 가능하게 하기 위한 슬롯부(ex314), 하드 디스크 등의 외부 기록 매체와 접속하기 위한 드라이버(ex315), 전화망과 접속하는 모뎀(ex316) 등을 가지고 있어도 된다. 또한, 기록 매체(ex216)는 저장하는 비휘발성/휘발성의 반도체 메모리 소자에 의해 전기적으로 정보의 기록을 가능하게 한 것이다. 텔레비전(ex300)의 각 부는 동기 버스를 통해 서로 접속되어 있다.
먼저, 텔레비전(ex300)이 안테나(ex204) 등에 의해 외부로부터 취득한 다중화 데이터를 복호화하여 재생하는 구성에 대해 설명한다. 텔레비전(ex300)은 원격 컨트롤러(ex220) 등에서 사용자 조작을 받아, CPU 등을 갖는 제어부(ex310)의 제어에 의거하여 변조/복조부(ex302)에서 복조한 다중화 데이터를 다중화/역다중화부(ex303)에서 분리한다. 또한, 텔레비전(ex300)은 분리된 음성 데이터를 음성 신호 처리부(ex304)에서 복호화하고, 분리된 영상 데이터를 영상 신호 처리부(ex305)에서 상기 각 실시 형태에서 설명한 복호화 방법을 이용하여 복호화한다. 복호화된 음성 신호, 영상 신호는 각각 출력부(ex309)에서 외부를 향해 출력된다. 출력할 때에는, 음성 신호와 영상 신호가 동기하여 재생하도록 버퍼(ex318, ex319) 등에 일단 이러한 신호를 축적하면 된다. 또한, 텔레비전(ex300)은 방송 등에서부터가 아니라, 자기/광 디스크, SD 카드 등의 기록 매체(ex215, ex216)에서 다중화 데이터를 독출해도 된다. 다음에, 텔레비전(ex300)이 음성 신호와 영상 신호를 부호화하고 외부로 송신 또는 기록 매체 등에 기록하는 구성에 대해 설명한다. 텔레비전(ex300)은 원격 컨트롤러(ex220) 등에서 사용자 조작을 받아, 제어부(ex310)의 제어에 의거하여 음성 신호 처리부(ex304)에서 음성 신호를 부호화하고, 영상 신호 처리부(ex305)에서 영상 신호를 상기 각 실시 형태에서 설명한 부호화 방법을 이용하여 부호화한다. 부호화된 음성 신호, 영상 신호는 다중화/역다중화부(ex303)에서 다중화되어 외부에 출력된다. 다중화할 때에는, 음성 신호와 영상 신호가 동기하도록 버퍼(ex320, ex321) 등에 일단 이러한 신호를 축적하면 된다. 또한, 버퍼(ex318, ex319, ex320, ex321)는 도시하고 있는 바와 같이 복수 구비하고 있어도 되고, 하나 이상의 버퍼를 공유하는 구성이어도 된다. 또한, 도시하고 있는 이외에, 예를 들면, 변조/복조부(ex302)나 다중화/역다중화부(ex303) 사이 등에서도 시스템의 오버플로우, 언더플로우를 방지하는 완충재로서 버퍼에 데이터를 축적하는 것으로 해도 된다.
또한, 텔레비전(ex300)은 방송 등이나 기록 매체 등으로부터 음성 데이터, 영상 데이터를 취득하는 이외에, 마이크나 카메라의 AV 입력을 접수하는 구성을 구비하며, 그들로부터 취득한 데이터에 대해 부호화 처리를 행해도 된다. 또한, 여기에서는 텔레비전(ex300)은 상기의 부호화 처리, 다중화 및 외부 출력이 가능한 구성으로서 설명했지만, 이러한 작업을 행할 수 없으며, 상기 수신, 복호화 처리, 외부 출력만 가능한 구성이어도 된다.
또한, 리더/레코더(ex218)로 기록 매체로부터 다중화 데이터를 독출하거나 또는 기록하는 경우에는, 상기 복호화 처리 또는 부호화 처리는 텔레비전(ex300)과 리더/레코더(ex218)의 어느 것으로 행해도 되고, 텔레비전(ex300)과 리더/레코더(ex218)가 서로 분담하여 행해도 된다.
일례로서, 광 디스크에서 데이터 판독 또는 기록을 하는 경우의 정보 재생/기록부(ex400)의 구성을 도 17에 나타낸다. 정보 재생/기록부(ex400)는 이하에 설명하는 요소(ex401, ex402, ex403, ex404, ex405, ex406, ex407)를 구비한다. 광 헤드(ex401)는 광 디스크인 기록 매체(ex215)의 기록면에 레이저 스폿을 조사하여 정보를 기록, 기록 매체(ex215)의 기록면으로부터의 반사광을 검출하여 정보를 판독한다. 변조 기록부(ex402)는 광 헤드(ex401)에 내장된 반도체 레이저를 전기적으로 구동하여 기록 데이터에 따라 레이저 광의 변조를 행한다. 재생 복조부(ex403)는 광 헤드(ex401)에 내장된 광 검출기에 의해 기록면으로부터의 반사광을 전기적으로 검출한 재생 신호를 증폭하고, 기록 매체(ex215)에 기록된 신호 성분을 분리하여 복조하고 필요한 정보를 재생한다. 버퍼(ex404)는 기록 매체(ex215)에 기록하기 위한 정보 및 기록 매체(ex215)에서 재생한 정보를 일시적으로 유지한다. 디스크 모터(ex405)는 기록 매체(ex215)를 회전시킨다. 서보 제어부(ex406)는 디스크 모터(ex405)의 회전 구동을 제어하면서 광 헤드(ex401)를 소정의 정보 트랙으로 이동시키고, 레이저 스폿의 추종 처리를 행한다. 시스템 제어부(ex407)는 정보 재생/기록부(ex400) 전체의 제어를 행한다. 상기의 독출이나 기록의 처리는 시스템 제어부(ex407)가 버퍼(ex404)에 유지된 각종 정보를 이용하거나, 또는 필요에 따라 새로운 정보의 생성·추가를 행함과 더불어, 변조 기록부(ex402), 재생 복조부(ex403), 서보 제어부(ex406)를 함께 동작시키면서 광 헤드(ex401)를 통해 정보의 기록 재생을 행함으로써 실현된다. 시스템 제어부(ex407)는 예를 들면, 마이크로 프로세서로 구성되어, 독출 기록 프로그램을 실행함으로써 그 처리를 실행한다.
이상에서는 광 헤드(ex401)는 레이저 스폿을 조사하는 것으로 하여 설명했지만, 근접장 광을 이용하여 보다 고밀도인 기록을 행하는 구성이어도 된다.
도 18에 광 디스크인 기록 매체(ex215)의 모식도를 나타낸다. 기록 매체(ex215)의 기록면에는 안내 홈(Groove)이 나선형상으로 형성되고, 정보 트랙(ex230)에는 미리 그루브의 형상의 변화에 의해 디스크 상의 절대 위치를 나타내는 번지 정보가 기록되어 있다. 이 번지 정보는 데이터를 기록하는 단위인 기록 블록(ex231)의 위치를 특정하기 위한 정보를 포함하고, 기록이나 재생을 행하는 장치에서 정보 트랙(ex230)을 재생하여 번지 정보를 판독함으로써 기록 블록을 특정 할 수 있다. 또한, 기록 매체(ex215)는 데이터 기록 영역(ex233), 내주 영역(ex232), 외주 영역(ex234)을 포함한다. 사용자 데이터를 기록하기 위해 이용하는 영역이 데이터 기록 영역(ex233)이며, 데이터 기록 영역(ex233)보다 내주 또는 외주에 배치되어 있는 내주 영역(ex232)과 외주 영역(ex234)은 사용자 데이터의 기록 이외의 특정 용도에 이용된다. 정보 재생/기록부(ex400)는 이와 같은 기록 매체(ex215)의 데이터 기록 영역(ex233)에 대해 부호화된 음성 데이터, 영상 데이터 또는 그 데이터를 다중화한 다중화 데이터의 판독 기록을 행한다.
이상에서는, 1층의 DVD, BD 등의 광 디스크를 예로 들어 설명했지만, 이에 한정된 것이 아니라, 다층 구조로서 표면 이외에도 기록 가능한 광 디스크이어도 된다. 또한, 디스크의 동일한 장소에 다양한 상이한 파장의 색의 광을 이용하여 정보를 기록하거나 다양한 각도에서 상이한 정보의 층을 기록하는 등 다차원적인 기록/재생을 행하는 구조의 광 디스크이어도 된다.
또한, 디지털 방송 시스템(ex200)에 있어서, 안테나(ex205)를 갖는 차(ex210)에서 위성(ex202) 등으로부터 데이터를 수신하고, 차(ex210)가 갖는 카 네비게이션(ex211) 등의 표시 장치에 동화상을 재생하는 것도 가능하다. 또한, 카 네비게이션(ex211)의 구성은 예를 들어, 도 16에 나타내는 구성 중에, GPS 수신부를 더한 구성이 생각되고, 마찬가지인 것이 컴퓨터(ex111)나 휴대 전화(ex114) 등에서도 생각될 수 있다.
도 19A는 상기 실시 형태에서 설명한 동화상 복호화 방법 및 동화상 부호화 방법을 이용한 휴대 전화(ex114)를 나타내는 도면이다. 휴대 전화(ex114)는 기지국(ex110)과의 사이에서 전파를 송수신하기 위한 안테나(ex350), 영상, 정지 화상을 촬영할 수 있는 카메라부(ex365), 카메라부(ex365)에서 촬상한 영상, 안테나(ex350)에서 수신한 영상 등이 복호화된 데이터를 표시하는 액정 디스플레이 등의 표시부(ex358)를 구비한다. 휴대 전화(ex114)는 또한, 조작키부(ex366)를 갖는 본체부, 음성을 출력하기 위한 스피커 등인 음성 출력부(ex357), 음성을 입력하기 위한 마이크 등인 음성 입력부(ex356), 촬영한 영상, 정지 화상, 녹음한 음성, 또는 수신한 영상, 정지 화상, 메일 등의 부호화된 데이터 또는 복호화된 데이터를 보존하는 메모리부(ex367), 또는 마찬가지로 데이터를 보존하는 기록 매체와의 인터페이스부인 슬롯부(ex364)를 구비한다.
또한, 휴대 전화(ex114)의 구성예에 대해 도 19B를 이용하여 설명한다. 휴대 전화(ex114)는 표시부(ex358) 및 조작키부(ex366)를 구비한 본체부의 각 부를 총괄적으로 제어하는 주제어부(ex360)에 대해, 전원 회로부(ex361), 조작 입력 제어부(ex362), 영상 신호 처리부(ex355), 카메라 인터페이스부(ex363), LCD(Liquid Crystal Display) 제어부(ex359), 변조/복조부(ex352), 다중화/역다중화부(ex353), 음성 신호 처리부(ex354), 슬롯부(ex364), 메모리부(ex367)가 버스(ex370)를 통해 서로 접속되어 있다.
전원 회로부(ex361)는 사용자의 조작에 의해 종화(終話) 및 전원 키가 온 상태로 되면, 배터리 팩에서 각 부에 대해 전력을 공급함으로써 휴대 전화(ex114)를 작동 가능한 상태로 기동한다.
휴대 전화(ex114)는 CPU, ROM, RAM 등을 가지는 주제어부(ex360)의 제어에 의거하여 음성 통화 모드 시에 음성 입력부(ex356)에서 수음(收音)한 음성 신호를 음성 신호 처리부(ex354)에서 디지털 음성 신호로 변환하고, 이를 변조/복조부(ex352)에서 스펙트럼 확산 처리하며, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후 안테나(ex350)를 통해 송신한다. 또한, 휴대 전화(ex114)는 음성 통화 모드 시에 안테나(ex350)를 통해 수신한 수신 데이터를 증폭하여 주파수 변환 처리 및 아날로그 디지털 변환 처리를 변조/복조 부(ex352)에서 스펙트럼 역확산 처리하고, 음성 신호 처리부(ex354)에서 아날로그 음성 신호로 변환한 후, 이를 음성 출력부(ex357)에서 출력한다.
또한, 데이터 통신 모드 시에 전자 메일을 송신하는 경우, 본체부의 조작키부(ex366) 등의 조작에 의해 입력된 이메일의 텍스트 데이터는 조작 입력 제어부(ex362)를 통해 주제어부(ex360)에 송출된다. 주제어부(ex360)는 텍스트 데이터를 변조/복조부(ex352)에서 스펙트럼 확산 처리를 하여, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 통해 기지국(ex110)에 송신한다. 전자 메일을 수신하는 경우는 수신된 데이터에 대해 이 거의 역의 처리가 행해져서, 표시부(ex358)에 출력된다.
데이터 통신 모드 시에 영상, 정지 화상, 또는 영상과 음성을 송신하는 경우, 영상 신호 처리부(ex355)는 카메라부(ex365)에서 공급 된 영상 신호를 상기 각 실시 형태에서 설명한 동화상 부호화 방법에 의해 압축 부호화하고(즉, 본 발명의 일 실시 형태에 따른 화상 부호화 장치로서 기능한다), 부호화된 영상 데이터를 다중화/역다중화부(ex353)에 송출한다. 또한, 음성 신호 처리부(ex354)는 영상, 정지 화상 등을 카메라부(ex365)에서 촬상 중에 음성 입력부(ex356)에서 수음한 음성 신호를 부호화하여, 부호화된 음성 데이터를 다중화/역다중화부(ex353)에 송출한다.
다중화/역다중화부(ex353)는 영상 신호 처리부(ex355)로부터 공급된 부호화된 영상 데이터와 음성 신호 처리부(ex354)로부터 공급된 부호화된 음성 데이터를 소정의 방식으로 다중화하고, 그 결과 얻어지는 다중화 데이터를 변조/복조부(변조/복조 회로부)(ex352)에서 스펙트럼 확산 처리를 하여, 송신/수신부(ex351)에서 디지털 아날로그 변환 처리 및 주파수 변환 처리를 실시한 후에 안테나(ex350)를 통해 송신한다.
데이터 통신 모드 시에 홈페이지 등에 링크된 동화상 파일의 데이터를 수신 하는 경우, 또는 영상 및 또는 음성이 첨부된 전자 메일을 수신하는 경우, 안테나(ex350)를 통해 수신된 다중화 데이터를 복호화하기 위해 다중화/역다중화부(ex353)는 다중화 데이터를 분리함으로써 영상 데이터의 비트 스트림과 음성 데이터의 비트 스트림으로 나누어, 동기 버스(ex370)를 통해 부호화된 영상 데이터를 영상 신호 처리부(ex355)에 공급하는 것과 더불어, 부호화된 음성 데이터를 음성 신호 처리부(ex354)에 공급한다. 영상 신호 처리부(ex355)는 상기 각 실시 형태에서 설명한 동화상 부호화 방법에 대응한 동화상 복호화 방법에 의해 복호화함으로써 영상 신호를 복호하고(즉, 본 발명의 일 실시 형태에 따른 화상 복호화 장치로서 기능한다), LCD 제어부(ex359)를 통해 표시부(ex358)로부터, 예를 들면 홈페이지에 링크된 동화상 파일에 포함되는 영상, 정지 화상이 표시된다. 또한 음성 신호 처리부(ex354)는 음성 신호를 복호하여 음성 출력부(ex357)에서 음성이 출력된다.
또한, 상기 휴대 전화(ex114) 등의 단말은 텔레비전(ex300)과 마찬가지로, 부호화기·복호화기를 모두 가지는 송수신형 단말 외에, 부호화기만의 송신 단말, 복호화기만의 수신 단말이라는 세 가지 실장 형식이 생각될 수 있다. 또한, 디지털 방송용 시스템(ex200)에 있어서, 영상 데이터에 음악 데이터 등이 다중화된 다중화 데이터를 수신, 송신하는 것으로 하여 설명했지만, 음성 데이터 이외에 영상에 관련하는 문자 데이터 등이 다중화된 데이터이어도 되고, 다중화 데이터가 아니라 영상 데이터 자체이어도 된다.
이와 같이, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 동화상 복호화 방법을 상술한 어느 하나의 기기·시스템에 이용하는 것은 가능하며, 이렇게 함으로써 상기 각 실시 형태에서 설명한 효과를 얻을 수있다.
또한, 본 발명은 이러한 상기 실시 형태에 한정되는 것은 아니고, 본 발명의 범위를 벗어나지 않고 다양한 변형 또는 수정이 가능하다.
[실시 형태 3]
상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치와, MPEG-2, MPEG4-AVC, VC-1 등 상이한 규격에 준거한 동화상 부호화 방법 또는 장치를 필요에 따라 적절히 전환함으로써 영상 데이터를 생성하는 것도 가능하다.
여기에서, 각각 서로 상이한 규격에 준거하는 복수의 영상 데이터를 생성한 경우, 복호할 때 각각의 규격에 대응한 복호화 방법을 선택할 필요가 있다. 그러나, 복호하는 영상 데이터가 어떤 규격에 준거하는 것인지 식별할 수 없으므로, 적절한 복호 방법을 선택할 수 없다는 과제를 생성한다.
이 과제를 해결하기 위해, 영상 데이터에 음성 데이터 등을 다중화한 다중화 데이터는, 비디오 데이터가 어떤 규격에 준거하는 것인지를 나타내는 식별 정보를 포함하는 구성으로 한다. 상기 각 실시 형태에 나타내는 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 포함하는 다중화 데이터의 구체적인 구성을 이하 설명한다. 다중화 데이터는 MPEG-2 트랜스포트 스트림 형식의 디지털 스트림이다.
도 20은 다중화 데이터의 구성을 나타내는 도면이다. 도 20에 나타내는 바와 같이 다중화 데이터는 영상 스트림, 음성 스트림, 프레젠테이션 그래픽스 스트림(PG), 인터랙티브 그래픽스 스트림 중 하나 이상을 다중화함으로써 얻을 수 있다. 영상 스트림은 영화의 주영상 및 부영상을, 음성 스트림(IG)은 영화의 주음성 부분과 그 주음성과 믹싱하는 부음성을, 프레젠테이션 그래픽스 스트림은 영화의 자막을 각각 나타내고 있다. 여기에서 주영상이란 화면에 표시되는 통상의 영상을 나타내고, 부영상이란 주영상 중에 작은 화면으로 표시하는 영상의 것이다. 또한, 인터랙티브 그래픽스 스트림은 화면 상에 GUI 부품을 배치함으로써 작성되는 대화 화면을 나타내고 있다. 영상 스트림은 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거한 동화상 부호화 방법 또는 장치에 의해 부호화되어 있다. 음성 스트림은 돌비 AC-3, Dolby Digital Plus, MLP, DTS DTS-HD 또는 리니어 PCM 등의 방식으로 부호화되어 있다.
다중화 데이터에 포함되는 각 스트림은 PID에 의해 식별된다. 예를 들어, 영화의 영상에 이용하는 영상 스트림에는 0x1011이, 음성 스트림에는 0x1100에서 0x111F까지가, 프레젠테이션 그래픽스에는 0x1200에서 0x121F까지가, 인터랙티브 그래픽스 스트림에는 0x1400에서 0x141F까지가, 영화의 부영상에 이용하는 영상 스트림에는 0x1B00에서 0x1B1F까지가, 주음성과 믹싱하는 부음성에 이용하는 음성 스트림에는 0x1A00에서 0x1A1F가 각각 할당되어 있다.
도 21은 다중화 데이터가 어떻게 다중화되는지를 모식적으로 나타내는 도면이다. 먼저, 복수의 비디오 프레임으로 이루어지는 영상 스트림(ex235), 복수의 오디오 프레임으로 이루어지는 음성 스트림(ex238)을, 각각 PES 패킷열(ex236 및 ex239)로 변환하고 TS 패킷(ex237 및 ex240)으로 변환한다. 동일하게, 프레젠테이션 그래픽스 스트림(ex241) 및 인터랙티브 그래픽스(ex244)의 데이터를 각각 PES 패킷열(ex242 및 ex245)로 변환하고, TS 패킷(ex243 및 ex246)으로 변환한다. 다중화 데이터(ex247)는 이 TS 패킷을 하나의 스트림으로 다중화함으로써 구성된다.
도 22는 PES 패킷열에 영상 스트림이 어떻게 저장되는지를 더욱 상세히 나타내고 있다. 도 22에 있어서의 제1 단째는 영상 스트림의 비디오 프레임열을 나타낸다. 제2 단째는 PES 패킷열을 나타낸다. 도 22의 화살표 yy1, yy2, yy3, yy4에 나타내는 바와 같이 영상 스트림에 있어서의 복수의 Video Presentation Unit인 I 픽처, B 픽처, P 픽처는 픽처마다 분할되어, PES 패킷의 페이로드에 저장된다. 각 PES 패킷은 PES 헤더를 가지고, PES 헤더에는 픽처의 표시 시각인 PTS(Presentation Time-Stamp)나 픽처의 복호 시각인 DTS(Decoding Time-Stamp)가 저장된다.
도 23은 다중화 데이터에 마지막으로 기록된 TS 패킷의 형식을 나타내고 있다. TS 패킷은 스트림을 식별하는 PID 등의 정보를 갖는 4Byte의 TS 헤더와 데이터를 저장하는 184Byte의 TS 페이로드로 구성되는 188Byte 고정 길이의 패킷이며, 상기 PES 패킷은 분할되어 TS 페이로드에 저장된다. BD-ROM의 경우, TS 패킷에는 4Byte의 TP_Extra_Header가 부여되며, 192Byte의 소스 패킷을 구성하고 다중화 데이터에 기록된다. TP_Extra_Header에는 ATS(Arrival_Time_Stamp) 등의 정보가 기재된다. ATS는 해당 TS 패킷의 디코더의 PID 필터로의 전송 개시 시각을 나타낸다. 다중화 데이터는 도 23 하단에 나타내는 바와 같이 소스 패킷이 늘어선 것으로 되어, 다중화 데이터의 선두로부터 증가하는 번호는 SPN(소스 패킷 번호)으로 칭해진다.
또한, 다중화 데이터에 포함되는 TS 패킷에는 영상·음성·자막 등의 각 스트림 이외에도 PAT(Program Association Table), PMT(Program Map Table), PCR(Program Clock Reference) 등이 있다. PAT는 다중화 데이터 중에 이용되는 PMT의 PID가 무엇인지를 나타내고, PAT 자신의 PID는 0으로 등록된다. PMT는 다중화 데이터 중에 포함되는 영상·음성·자막 등의 각 스트림의 PID와 각 PID에 대응하는 스트림의 속성 정보를 가지고 있으며, 또한 다중화 데이터에 관한 각종 디스크립터를 갖는다. 디스크립터에는 다중화 데이터의 카피를 허가·불허가를 지시하는 카피 제어 정보 등이 있다. PCR은 ATS의 시간축인 ATC(Arrival Time Clock)와 PTS·DTS의 시간축인 STC(System Time Clock)의 동기를 취하기 위해, 그 PCR 패킷이 디코더로 전송되는 ATS에 대응하는 STC 시간의 정보를 갖는다.
도 24는 PMT의 데이터 구조를 상세히 설명하는 도면이다. PMT의 선두에는 그 PMT에 포함되는 데이터의 길이 등을 기재한 PMT 헤더가 배치된다. 그 다음에는, 다중화 데이터에 관한 디스크립터가 복수 배치된다. 상기 카피 제어 정보 등이 디스크립터로서 기재된다. 디스크립터 이후에는 다중화 데이터에 포함되는 각 스트림에 관한 스트림 정보가 복수 배치된다. 스트림 정보는 스트림의 압축 코덱 등을 식별하기 위해 스트림 타입, 스트림의 PID, 스트림의 속성 정보(프레임 레이트, 애스펙트비 등)가 기재된 스트림 디스크립트로 구성된다. 스트림 디스크립터는 다중화 데이터에 존재하는 스트림의 수만큼 존재한다.
기록 매체 등에 기록하는 경우에는, 상기 다중화 데이터는 다중화 데이터 정보 파일과 함께 기록된다.
다중화 데이터 정보 파일은 도 25에 나타내는 바와 같이 다중화 데이터 관리 정보이며, 다중화 데이터와 1대1로 대응하고, 다중화 데이터 정보, 스트림 속성 정보와 엔트리 맵으로 구성된다.
다중화 데이터 정보는 도 25에 나타내는 바와 같이 시스템 속도, 재생 개시 시각, 재생 종료 시각으로 구성되어 있다. 시스템 레이트는 다중화 데이터의 후술하는 시스템 타겟 디코더의 PID 필터로의 최대 전송 속도를 나타낸다. 다중화 데이터 중에 포함되는 ATS의 간격은 시스템 레이트 이하가 되도록 설정되어 있다. 재생 개시 시각은 다중화 데이터의 선두의 비디오 프레임의 PTS이며, 재생 종료 시각은 다중화 데이터의 종단의 비디오 프레임의 PTS에 1 프레임씩 재생 간격을 더한 것이 설정된다.
스트림 속성 정보는 도 26에 나타내는 바와 같이 다중화 데이터에 포함되는 각 스트림에 대한 속성 정보가 PID 마다 등록된다. 속성 정보는 영상 스트림, 음성 스트림, 프레젠테이션 그래픽스 스트림, 인터랙티브 그래픽스 스트림 마다 상이한 정보를 갖는다. 영상 스트림 속성 정보는 영상 스트림이 어떤 압축 코덱으로 압축되었거나 또는 영상 스트림을 구성하는 개개의 픽처 데이터의 해상도가 어느 정도인지, 애스펙트비는 어느 정도인지, 프레임 속도는 어느 정도인지 등의 정보를 갖는다. 음성 스트림 속성 정보는 그 음성 스트림이 어떤 압축 코덱으로 압축되었는지, 그 음성 스트림에 포함되는 채널 수는 얼마인지, 어떤 언어에 대응하는지, 샘플링 주파수가 어느 정도인지 등의 정보를 갖는다. 이러한 정보는 플레이어가 재생하기 전의 디코더의 초기화 등에 이용된다.
본 실시 형태에 있어서는, 상기 다중화 데이터 중 PMT에 포함되는 스트림 타입을 이용한다. 또한, 기록 매체에 다중화 데이터가 기록되어 있는 경우에는, 다중화 데이터 정보에 포함되는 영상 스트림 속성 정보를 이용한다. 구체적으로는, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 있어서, PMT에 포함디는 스트림 타입 또는 영상 스트림 속성 정보에 대해 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내는 고유의 정보를 설정하는 단계 또는 수단을 설치한다. 이 구성에 의해, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터와, 다른 규격에 준거하는 영상 데이터와 식별할 수 있게 된다.
또한, 본 실시 형태에 있어서의 동화상 복호화 방법의 단계를 도 27에 나타낸다. 단계 exS100에 있어서, 다중화 데이터에서 PMT에 포함되는 스트림 타입 또는 다중화 데이터 정보에 포함되는 영상 스트림 특성 정보를 취득한다. 다음에, 단계 exS101에 있어서, 스트림 타입 또는 영상 스트림 속성 정보가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 다중화 데이터인 것을 나타내고 있는지의 여부를 판단한다. 그리고, 스트림 타입 또는 영상 스트림 속성 정보가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것이라고 판단된 경우에는, 단계 exS102에 있어서, 상기 각 실시 형태에서 나타낸 동화상 복호 방법에 의해 복호를 행한다. 또한, 스트림 타입 또는 영상 스트림 속성 정보가 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 것임을 나타내고 있는 경우에는 단계 exS103에 있어서 종래의 규격에 준거한 동화상 복호 방법에 의해 복호를 행한다.
이와 같이, 스트림 타입 또는 영상 스트림 속성 정보에 새로운 고유값을 설정함으로써 복호할 때 상기 각 실시 형태에서 나타낸 동화상 복호화 방법 또는 장치에서 복호할 수 있는지를 판단할 수 있다. 따라서, 상이한 규격에 준거하는 다중화 데이터가 입력된 경우에도 적절한 복호화 방법 또는 장치를 선택할 수 있기 때문에, 에러를 발생하지 않고 복호할 수 있게 된다. 또한, 본 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치, 또는 동화상 복호 방법 또는 장치를 상술한 어느 하나의 기기·시스템에 이용하는 것도 가능하다.
[실시 형태 4]
상기 각 실시 형태에서 나타낸 동화상 부호화 방법 및 장치, 동화상 복호화 방법 및 장치는 전형적으로는 집적 회로인 LSI로 실현된다. 일례로서, 도 28에 1칩화된 LSI(ex500)의 구성을 나타낸다. LSI(ex500)는 이후에 설명하는 요소(ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, ex509)를 구비하고, 각 요소는 버스(ex510)를 통해 접속하고 있다. 전원 회로부(ex505)는 전원이 온 상태의 경우에 각 부에 대해 전력을 공급함으로써 동작 가능한 상태로 기동한다.
예를 들어, 부호화 처리를 행하는 경우에는, LSI(ex500)는 CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 갖는 제어부(ex501)의 제어에 의거하여 AV I/O(ex509)에 의해 마이크(ex117)나 카메라(ex113) 등으로부터 AV 신호를 입력한다. 입력된 AV 신호는 일단 SDRAM 등의 외부의 메모리(ex511)에 축적된다. 제어부(ex501)의 제어에 의거하여 축적된 데이터는 처리량이나 처리 속도에 따라 적절하게 여러 번 나누는 등 되어 신호 처리부(ex507)에 보내져, 신호 처리부(ex507)에 있어서 음성 신호의 부호화 및/또는 영상 신호의 부호화가 행해진다. 여기에서 영상 신호의 부호화 처리는 상기 각 실시 형태에서 설명한 부호화 처리이다. 신호 처리부(ex507)에서는 또한, 경우에 따라 부호화된 음성 데이터와 부호화된 영상 데이터를 다중화하는 등의 처리를 행해, 스트림 I/O(ex506)에서 외부로 출력한다. 이 출력된 다중화 데이터는 기지국(ex107)을 향해 송신되거나 또는 기록 매체(ex215)에 기록되거나 한다. 또한, 다중화할 때에는 동기하도록 일단 버퍼(ex508)에 데이터를 축적하면 된다.
또한, 상기에서는 메모리(ex511)가 LSI(ex500)의 외부 구성으로서 설명했지만, LSI(ex500)의 내부에 포함되는 구성이어도 된다. 버퍼(ex508)도 하나에 한정되는 것이 아니라 복수의 버퍼를 구비하여도 된다. 또한, LSI(ex500)는 1칩화되어도 되고, 복수 칩화되어도 된다.
또한, 상기에서는 제어부(ex501)가 CPU(ex502), 메모리 컨트롤러(ex503), 스트림 컨트롤러(ex504), 구동 주파수 제어부(ex512) 등을 갖는 것으로 하고 있지만, 제어부(ex501)의 구성은 이 구성에 한정되지 않는다. 예를 들어, 신호 처리부(ex507)가 CPU를 더 구비하는 구성이어도 된다. 신호 처리부(ex507) 내부에도 CPU를 설치함으로써, 처리 속도를 보다 향상시킬 수 있게 된다. 또 다른 예로서, CPU(ex502)가 신호 처리부(ex507), 또는 신호 처리부(ex507)의 일부인 예를 들어 음성 신호 처리부를 구비하는 구성이어도 된다. 이러한 경우에는, 제어부(ex501)는 신호 처리부(ex507) 또는 그 일부를 갖는 CPU(ex502)를 구비하는 구성이 된다.
또한, 여기에서는 LSI로 했지만, 집적도의 상위에 의해, IC, 시스템 LSI, 수퍼 LSI, 울트라 LSI라고 호칭되는 경우도 있다.
또한, 집적 회로화의 방법은 LSI에 한정되는 것은 아니고, 전용 회로 또는 범용 프로세서로 실현해도 된다. LSI 제조 후에 프로그램할 수 있는 FPGA(Field Programmable Gate Array)나 LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 된다. 이 같은 프로그래머블 로직 디바이스는 전형적으로는 소프트웨어 또는 펌웨어를 구성하는 프로그램을 로드하거나 또는 메모리 등으로부터 판독함으로써, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 동화상 복호화 방법을 실행할 수 있다.
또한, 반도체 기술의 진보 또는 파생하는 다른 기술에 의해 LSI를 치환하는 집적 회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행해도 된다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
[실시 형태 5]
상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성 된 영상 데이터를 복호하는 경우, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터를 복호하는 경우에 비해 처리량이 증가하는 것을 생각할 수 있다. 그 때문에, LSI(ex500)에 있어서, 종래의 규격에 준거하는 영상 데이터를 복호할 때의 CPU(ex502)의 구동 주파수보다 높은 구동 주파수로 설정할 필요가 있다. 그러나, 구동 주파수가 높아지면, 소비 전력이 증가한다는 과제가 생긴다.
이 과제를 해결하기 위해, 텔레비전(ex300), LSI(ex500) 등의 동화상 복호화 장치는 영상 데이터가 어떤 규격에 준거하는 것인지를 식별하고, 규격에 따라 구동 주파수를 전환하는 구성으로 한다. 도 29는 본 실시 형태에 있어서의 구성 ex800을 나타내고 있다. 구동 주파수 변환부(ex803)는 영상 데이터가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 구동 주파수를 높게 설정한다. 그리고, 상기 각 실시 형태에서 나타낸 동화상 복호화 방법을 실행하는 암호 처리부(ex801)에 대해 영상 데이터를 복호하도록 지시한다. 한편, 영상 데이터가 종래의 규격에 준거하는 영상 데이터인 경우에는, 영상 데이터가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해 구동 주파수를 낮게 설정한다. 그리고, 종래의 규격에 준거하는 복호 처리부(ex802)에 대해 영상 데이터를 복호하도록 지시한다.
보다 구체적으로는, 구동 주파수 변환부(ex803)는 도 28의 CPU(ex502)와 구동 주파수 제어부(ex512)으 구성된다. 또한, 상기 각 실시 형태에서 나타낸 동화상 복호화 방법을 실행하는 암호 처리부(ex801) 및 종래의 규격에 준거하는 암호 처리부(ex802)는 도 28의 신호 처리부(ex507)에 해당한다. CPU(ex502)는 영상 데이터가 어떤 규격에 준거하는 것인지를 식별한다. 그리고, CPU(ex502)에서의 신호에 의거하여 구동 주파수 제어부(ex512)는 구동 주파수를 설정한다. 또한, CPU(ex502)로부터의 신호에 의거하여 신호 처리부(ex507)는 영상 데이터의 복호를 행한다. 여기에서, 영상 데이터의 식별에는 예를 들어, 실시 형태 5에 기재한 식별 정보를 이용하는 것을 생각할 수 있다. 식별 정보는 실시 형태 5에 기재한 것에 한정되지 않고, 영상 데이터가 어떤 규격에 준거하는지 식별할 수 있는 정보이면 된다. 예를 들면, 영상 데이터를 텔레비전에 이용되는 것인지, 디스크에 이용되는 것인지 등을 식별하는 외부 신호에 의거하여 영상 데이터가 어떤 규격에 준거하는 것인지 식별 가능한 경우에는, 이러한 외부 신호에 의거하여 식별해도 된다. 또한, CPU(ex502)에 있어서의 구동 주파수의 선택은 예를 들어, 도 21과 같은 영상 데이터의 규격과, 구동 주파수를 대응시킨 룩업 테이블에 의거하여 행하는 것을 생각할 수 있다. 룩업 테이블을 버퍼(ex508)나, LSI의 내부 메모리에 저장해 놓고, CPU(ex502)가 이 룩업 테이블을 참조함으로써 구동 주파수를 선택하는 것이 가능하다.
도 20은 본 실시 형태의 방법을 실시하는 단계를 나타내고 있다. 먼저, 단계 exS200에서는 신호 처리부(ex507)에 있어서, 다중화 데이터로부터 식별 정보를 취득한다. 다음에, 단계 exS201에서는 CPU(ex502)에 있어서 식별 정보에 의거하여 영상 데이터가 상기 각 실시 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인지의 여부를 식별한다. 영상 데이터가 상기 각 실시 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에는, 단계 exS202에 있어서 구동 주파수를 높게 설정하는 신호를 CPU(ex502)가 구동 주파수 제어부(ex512)에 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 높은 구동 주파수로 설정된다. 한편, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터임을 나타내고 있는 경우에는, 단계 exS203에 있어서 구동 주파수를 낮게 설정하는 신호를 CPU(ex502)가 구동 주파수 제어부(ex512)에 보낸다. 그리고, 구동 주파수 제어부(ex512)에 있어서, 영상 데이터가 상기 각 실시 형태에서 나타낸 부호화 방법 또는 장치에 의해 생성된 것인 경우에 비해 낮은 구동 주파수로 설정된다.
또한, 구동 주파수의 전환에 연동하여 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 변경함으로써 전력 절감 효과를 더욱 높일 수 있다. 예를 들면, 구동 주파수를 낮게 설정하는 경우에는, 이에 따라 구동 주파수를 높게 설정하고 있는 경우에 비해 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것을 생각할 수 있다.
또한, 구동 주파수의 설정 방법은 복호할 때의 처리량이 큰 경우에, 구동 주파수를 높게 설정하고, 복호할 때의 처리량이 작은 경우에, 구동 주파수를 낮게 설정하면 되며, 상술한 설정 방법에 한정되지 않는다. 예를 들어, MPEG4-AVC 규격에 준거하는 영상 데이터를 복호하는 처리량 쪽이, 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터를 복호하는 처리량보다 큰 경우에는 구동 주파수의 설정을 상술한 경우의 역으로 하는 것을 생각할 수 있다.
또한, 구동 주파수의 설정 방법은 구동 주파수를 낮게 하는 구성에 한정되지 않는다. 예를 들어, 식별 정보가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 높게 설정하고, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터임을 나타내고 있는 경우에는 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치에 부여하는 전압을 낮게 설정하는 것도 생각할 수 있다. 또 다른 예로서는, 식별 정보가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에는, CPU(ex502)의 구동을 정지시키는 일 없이, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터임을 나타내고 있는 경우에는 처리에 여유가 있기 때문에 CPU(ex502)의 구동을 일시 정지시키는 것도 생각할 수 있다. 식별 정보가 상기 각 실시 형태에서 나타낸 동화상 부호화 방법 또는 장치에 의해 생성된 영상 데이터인 것을 나타내고 있는 경우에도, 처리에 여유가 있으면, CPU(ex502)의 구동을 일시 정지시키는 것도 생각할 수 있다. 이 경우는, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 영상 데이터임을 나타내고 있는 경우에 비해 정지 시간을 짧게 설정하는 것을 생각할 수 있다.
이와 같이, 영상 데이터가 준거하는 규격에 따라 구동 주파수를 전환함으로써 전력 절약화를 도모할 수 있게 된다. 또한, 전지를 이용하여 LSI(ex500) 또는 LSI(ex500)를 포함하는 장치를 구동하고 있는 경우에는, 전력 절약화에 따라 전지의 수명을 연장하는 것이 가능하다.
[실시 형태 6]
텔레비전이나 휴대 전화 등, 상술한 기기·시스템에는 상이한 규격에 준거하는 복수의 영상 데이터가 입력되는 경우가 있다. 이와 같이, 상이한 규격에 준거하는 복수의 영상 데이터가 입력된 경우에도 복호할 수 있도록 하기 위해, LSI(ex500)의 신호 처리부(ex507)가 복수의 규격에 대응하고 있을 필요가 있다. 그러나, 각각의 규격에 대응하는 신호 처리부(ex507)를 개별적으로 이용하면, LSI(ex500)의 회로 규모가 커지고 또한, 비용이 증가한다는 과제가 생긴다.
이 과제를 해결하기 위해, 상기 각 실시 형태에서 나타낸 동화상 복호 방법을 실행하기 위한 복호 처리부와, 종래의 MPEG-2, MPEG4-AVC, VC-1 등의 규격에 준거하는 복호 처리부를 일부 공유화하는 구성으로 한다. 이 구성예를 도 22A의 ex900에 나타낸다. 예를 들어, 상기 각 실시 형태에서 나타낸 동화상 복호 방법과, MPEG4-AVC 규격에 준거하는 동영상 복호 방법은 엔트로피 부호화, 역양자화, 디블로킹 필터, 움직임 보상 등의 처리에 있어서 처리 내용이 일부 공통된다. 공통되는 처리 내용에 대해서는 MPEG4-AVC 규격에 대응하는 복호 처리부(ex902)를 공유하고, MPEG4-AVC 규격에 대응하지 않는 본 발명의 일 양태에 특유의 다른 처리 내용에 대해서는 전용의 복호 처리부(ex901)을 이용한다고 하는 구성을 생각할 수 있다. 특히, 본 발명의 일 양태는 엔트로피 복호화에 특징을 가지고 있기 때문에 예를 들어, 엔트로피 복호에 대해서는 전용의 복호 처리부(ex901)를 이용하고, 그 이외의 역양자화, 디블로킹 필터, 움직임 보상 중 어느 하나 또는 모든 처리에 대해서는 복호 처리부를 공유하는 것을 생각할 수 있다. 복호 처리부의 공유화에 관해서는 공통되는 처리 내용에 대해서는 상기 각 실시 형태에서 나타낸 동화상 복호화 방법을 실행하기 위한 복호 처리부를 공유하고, MPEG4-AVC 규격에 특유의 처리 내용에 대해서는 전용의 복호 처리부를 이용하는 구성이어도 된다.
또한, 처리를 일부 공유화 다른 예를 도 22B의 ex1000에 나타낸다. 이 예에서는 본 발명의 일 양태에 특유의 처리 내용에 대응한 전용의 암호 처리부(ex1001)와, 다른 종래 규격에 특유의 처리 내용에 대응한 전용의 복호 처리부(ex1002)와, 본 발명의 일 양태에 따른 동화상 복호 방법과 다른 종래 규격의 동화상 복호 방법에 공통되는 처리 내용에 대응한 공용의 복호 처리부(ex1003)를 이용하는 구성으로 하고 있다. 여기에서, 전용의 복호 처리부(ex1001, ex1002)는 반드시 본 발명의 일 양태 또는 다른 종래 규격에 특유의 처리 내용에 특화한 것이 아니라, 다른 범용 처리를 실행할 수 있는 것이어도 된다. 또한, 본 실시 형태의 구성을 LSI(ex500)에서 실장하는 것도 가능하다.
이와 같이, 본 발명의 일 양태에 따른 동화상 복호 방법과, 종래의 규격의 동화상 복호 방법에서 공통되는 처리 내용에 대해, 복호 처리부를 공유함으로써 LSI 회로 규모를 작게 하고 또한, 비용을 절감할 수 있다.
[산업상 이용 가능성]
본 발명에 따른 화상 부호화 방법 및 화상 복호 방법은 화질의 열화를 방지 함과 더불어, 처리 효율을 향상시킬 수 있다는 효과를 발휘하고, 예를 들어, 화상의 축적, 전송 및 통신 등의 다양한 용도에 이용 가능하다. 예를 들어, 본 발명에 따른 화상 부호화 방법 및 화상 복호 방법은 텔레비전, 디지털 비디오 레코더, 카 네비게이션, 휴대 전화, 디지털 카메라 및 디지털 비디오 카메라 등의 고해상도의 정보 표시 장치 및 영상 기기에 이용 가능하며 이용 가치가 높다.
100: 영상 부호화 장치
101: 변환부
102: 양자화부
103: 역양자화부
104: 역변환부
105: 블록 메모리
106: 프레임 메모리
107: 인트라 예측부
108: 인터 예측부
109: 엔트로피 부호화
110: 타일 분할부
111: 기록부
200: 영상 복호화 장치
201: 엔트로피 복호화부
202: 역양자화부
203: 역변환부
204: 블록 메모리
205: 프레임 메모리
206: 인트라 예측부
207: 인터 예측부
208: 서브 비트스트림 추출부
101: 변환부
102: 양자화부
103: 역양자화부
104: 역변환부
105: 블록 메모리
106: 프레임 메모리
107: 인트라 예측부
108: 인터 예측부
109: 엔트로피 부호화
110: 타일 분할부
111: 기록부
200: 영상 복호화 장치
201: 엔트로피 복호화부
202: 역양자화부
203: 역변환부
204: 블록 메모리
205: 프레임 메모리
206: 인트라 예측부
207: 인터 예측부
208: 서브 비트스트림 추출부
Claims (10)
- 픽처를 부호화하기 위한 부호화 방법으로서, 상기 부호화 방법은:
상기 픽처를 복수개의 타일로 분할하는 단계 - 상기 복수개의 타일 각각은 폭 파라미터 및 높이 파라미터에 의해 특징지어짐 - ;
복수개의 파라미터를 비트스트림의 헤더에 기록하는 단계 - 상기 복수개의 파라미터는 상기 복수개의 타일 중 하나인 현재 타일에 대한 움직임 예측에 대한 제약을 규정하는 플래그를 포함함 - ;
상기 복수개의 타일 각각의 폭 파라미터 및 높이 파라미터를 상기 비트스트림의 상기 헤더에 기록하는 단계;
상기 픽처에 포함된 나머지 복수개의 타일과의 공간 의존성 없이, 상기 나머지 복수개의 타일과 독립적으로 상기 현재 타일을 부호화하는 단계;
상기 픽처 내의 래스터 스캔 순서로 상기 현재 타일의 위치를 기초로 한 순서대로 상기 부호화된 현재 타일을 상기 비트스트림에 기록하는 단계; 및
상기 폭 파라미터, 상기 높이 파라미터 및 상기 플래그에 기초하여, 상기 현재 타일의 참조 픽처에 있어서, 상기 현재 타일과 동일한 영역을, 상기 현재 타일이 참조 가능한 참조 영역으로서 결정하는 단계를 포함하며,
결정된 상기 참조 영역만을 이용하여, 상기 현재 타일의 움직임 예측을 행하는, 부호화 방법. - 청구항 1에 있어서,
부호화된 상기 픽처를 규정하는 부호화된 데이터는 상기 비트스트림내의 상기 헤더에 후속하는, 부호화 방법. - 청구항 1에 있어서,
상기 헤더는 상기 픽처내에 포함된 상기 복수개의 타일에 의해 공통적으로 이용되는 상기 비트스트림의 보충적 인핸스먼트 정보인, 부호화 방법. - 청구항 1 내지 청구항 3 중 어느 한 항에 있어서,
참조 픽처 영역 내의 복수개의 참조 타일 중 하나의 참조 타일만을 이용하여 상기 현재 타일에 대한 움직임 예측을 수행하는 단계 - 상기 복수개의 참조 타일 중 상기 하나의 참조 타일은 상기 현재 타일에 대응함 - 을 더 포함하는, 부호화 방법. - 픽처를 부호화하기 위한 부호화 장치로서, 상기 부호화 장치는:
상기 픽처를 복수개의 타일로 분할하는 분할부 - 상기 복수개의 타일 각각은 폭 파라미터 및 높이 파라미터에 의해 특징지어짐 - ;
(i) 복수개의 파라미터를 비트스트림의 헤더에 기록 - 상기 복수개의 파라미터는 상기 복수개의 타일 중 하나인 현재 타일에 대한 움직임 예측에 대한 제약을 규정하는 플래그를 포함함 - 하고, 또한 (ii) 상기 복수개의 타일 각각의 폭 파라미터 및 높이 파라미터를 상기 비트스트림의 상기 헤더에 기록하는 기록부; 및
상기 픽처에 포함된 나머지 복수개의 타일과의 공간 의존성 없이, 상기 나머지 복수개의 타일과 독립적으로 상기 현재 타일을 부호화하는 부호화부
를 포함하며,
상기 기록부는, 상기 픽처 내의 래스터 스캔 순서로 상기 현재 타일의 위치를 기초로 한 순서대로 상기 부호화된 현재 타일을 상기 비트스트림에 더 기록하며,
상기 부호화 장치는, 상기 폭 파라미터, 상기 높이 파라미터 및 상기 플래그에 기초하여, 상기 현재 타일의 참조 픽처에 있어서, 상기 현재 타일과 동일한 영역을, 상기 현재 타일이 참조 가능한 참조 영역으로서 결정하고, 결정된 상기 참조 영역만을 이용하여, 상기 현재 타일의 움직임 예측을 행하는, 부호화 장치. - 청구항 1에 따른 부호화 방법에 의해 복수개의 타일로 분할되는 부호화된 픽처를 복호화하기 위한 복호화 방법으로서, 상기 복호화 방법은:
비트스트림의 헤더로부터 픽처 폭 파라미터 및 픽처 높이 파라미터를 파싱하는 단계;
상기 비트스트림의 상기 헤더로부터 개수 파라미터를 파싱하는 단계 - 상기 개수 파라미터는 픽처에 포함된 상기 복수개의 타일의 개수를 나타냄 - ;
상기 복수개의 타일 각각에 대하여 상기 비트스트림으로부터, 상기 타일을 특징짓는 폭 파라미터 및 높이 파라미터를 파싱하는 단계;
상기 복수개의 타일 각각을 복호화하는 단계 - 상기 복수개의 타일 중 적어도 하나의 타일은 상기 픽처에 포함된 나머지 복수개의 타일과의 공간 의존성 없이 상기 나머지 복수개의 타일과 독립적으로 복호화됨 - ; 및
상기 파싱된 픽처 폭 파라미터 및 상기 파싱된 픽처 높이 파라미터에 의해 정의된 직사각형 영역을 채우기 위하여 래스터 스캔 순서로 상기 복호화된 복수개의 타일을 배치함으로써 픽처를 재구성하는 단계
를 포함하는, 복호화 방법. - 청구항 6에 있어서,
부호화된 상기 픽처를 규정하는 부호화된 데이터는 상기 비트스트림내의 상기 헤더에 후속하는, 복호화 방법. - 청구항 6에 있어서,
상기 헤더는 상기 부호화된 픽처의 상기 복수개의 타일에 의해 공통적으로 이용되는 상기 비트스트림의 보충적 인핸스먼트 정보인, 복호화 방법. - 청구항 6 내지 청구항 8 중 어느 한 항에 있어서,
참조 픽처 영역 내의 복수개의 참조 타일 중 하나의 참조 타일만을 이용하여 상기 복수개의 타일 중 하나의 타일인 현재 타일에 대한 움직임 예측을 수행하는 단계 - 상기 복수개의 참조 타일 중 상기 하나의 참조 타일은 상기 현재 타일에 대응함 - 을 더 포함하는, 복호화 방법. - 청구항 5에 따른 부호화 장치에 의해 복수개의 타일로 분할되는 부호화된 픽처를 복호화하기 위한 복호화 장치로서, 상기 복호화 장치는:
(i) 비트스트림의 헤더로부터 픽처 폭 파라미터 및 픽처 높이 파라미터를 파싱하고, (ii) 상기 비트스트림의 상기 헤더로부터 개수 파라미터를 파싱 - 상기 개수 파라미터는 픽처에 포함된 상기 복수개의 타일의 개수를 나타냄 - 하며, 또한 (iii) 상기 복수개의 타일 각각에 대하여 상기 비트스트림으로부터, 상기 타일을 특징짓는 폭 파라미터 및 높이 파라미터를 파싱하는 파싱부;
상기 복수개의 타일 각각을 복호화하는 복호화부 - 상기 복수개의 타일 중 적어도 하나의 타일은 상기 픽처에 포함된 나머지 복수개의 타일과의 공간 의존성 없이 상기 나머지 복수개의 타일과 독립적으로 복호화됨 - ; 및
상기 파싱된 픽처 폭 파라미터 및 상기 파싱된 픽처 높이 파라미터에 의해 정의된 직사각형 영역을 채우기 위하여 래스터 스캔 순서로 상기 복호화된 복수개의 타일을 배치함으로써 픽처를 재구성하는 배치부
를 포함하는, 복호화 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161527151P | 2011-08-25 | 2011-08-25 | |
US61/527,151 | 2011-08-25 | ||
PCT/JP2012/005289 WO2013027407A1 (en) | 2011-08-25 | 2012-08-23 | Methods and apparatuses for encoding, extracting and decoding video using tiles coding scheme |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140057238A KR20140057238A (ko) | 2014-05-12 |
KR101912485B1 true KR101912485B1 (ko) | 2018-10-26 |
Family
ID=47746167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147000432A KR101912485B1 (ko) | 2011-08-25 | 2012-08-23 | 타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9225946B2 (ko) |
EP (1) | EP2749029A4 (ko) |
JP (1) | JP6384650B2 (ko) |
KR (1) | KR101912485B1 (ko) |
CN (1) | CN103650501B (ko) |
BR (1) | BR112014000368A2 (ko) |
WO (1) | WO2013027407A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020175908A1 (ko) * | 2019-02-26 | 2020-09-03 | 엘지전자 주식회사 | 시그널링된 정보에 기반한 픽처 파티셔닝 방법 및 장치 |
US12041272B2 (en) | 2019-06-19 | 2024-07-16 | Electronics And Telecommunications Research Institute | Virtual boundary signaling method and apparatus for video encoding/decoding |
US12101485B2 (en) | 2019-12-24 | 2024-09-24 | Electronics And Telecommunications Research Institute | Image encoding/decoding method and device |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201810667TA (en) | 2012-04-06 | 2019-01-30 | Sony Corp | Decoder and decoding method, as well as encoder and encoding method |
JP6214235B2 (ja) * | 2012-07-02 | 2017-10-18 | キヤノン株式会社 | ファイル生成方法、ファイル生成装置、及びプログラム |
EP3008896B1 (en) * | 2013-07-15 | 2021-03-31 | Sony Corporation | Extensions of motion-constrained tile sets sei message for interactivity |
WO2015007753A1 (en) | 2013-07-15 | 2015-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Network device and error handling |
US11425395B2 (en) * | 2013-08-20 | 2022-08-23 | Google Llc | Encoding and decoding using tiling |
JP6209026B2 (ja) * | 2013-08-30 | 2017-10-04 | キヤノン株式会社 | 画像符号化装置及びその制御方法 |
GB2523993A (en) * | 2014-03-06 | 2015-09-16 | Sony Corp | Data encoding and decoding |
US10986155B2 (en) | 2014-09-29 | 2021-04-20 | Avaya Inc. | Segmented video codec for high resolution and high frame rate video |
KR101756582B1 (ko) | 2016-01-12 | 2017-07-11 | 포항공과대학교 산학협력단 | 병렬 프로세싱을 위한 적응적 타일 분할 방법 및 이를 이용한 비디오 부호화/복호화 방법 |
KR20170095030A (ko) | 2016-02-12 | 2017-08-22 | 삼성전자주식회사 | 통신 시스템에서 vr 컨텐트 디스플레이를 지원하는 기법 |
FI20165114A (fi) | 2016-02-17 | 2017-08-18 | Nokia Technologies Oy | Laitteisto, menetelmä ja tietokoneohjelma videokoodausta ja videokoodauksen purkua varten |
CN109417638B (zh) * | 2016-05-28 | 2022-02-08 | 世宗大学校产学协力团 | 视频信号的编码或解码方法及装置 |
ES2963845T3 (es) | 2016-07-14 | 2024-04-02 | Koninklijke Kpn Nv | Codificación de vídeo |
WO2018092869A1 (ja) | 2016-11-21 | 2018-05-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
EP3920535A1 (en) * | 2016-11-21 | 2021-12-08 | Panasonic Intellectual Property Corporation of America | Splitting parameters in an image encoder and an image encoding method |
KR20190062585A (ko) | 2016-11-21 | 2019-06-05 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
KR102424829B1 (ko) | 2017-02-22 | 2022-07-25 | 에스케이텔레콤 주식회사 | 비디오 데이터가 부호화된 비트스트림을 처리하는 방법 |
WO2018155939A1 (ko) | 2017-02-22 | 2018-08-30 | 에스케이텔레콤 주식회사 | 영상 복호화 방법 및 장치 |
GB201704826D0 (en) * | 2017-03-27 | 2017-05-10 | Ocado Innovation Ltd | Wireless communications system with discrimination between extraneous received signals |
CN107888917B (zh) * | 2017-11-28 | 2021-06-22 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
WO2019243541A2 (en) * | 2018-06-21 | 2019-12-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Flexible tile partitions |
EP3811624A1 (en) | 2018-06-21 | 2021-04-28 | Telefonaktiebolaget LM Ericsson (publ) | Tile shuffling for 360 degree video decoding |
CN112640455B (zh) | 2018-06-21 | 2024-06-14 | 瑞典爱立信有限公司 | 视频编码中具有子图块的图块分区 |
CN112823525A (zh) | 2018-10-02 | 2021-05-18 | 瑞典爱立信有限公司 | 基于图块组id对图片进行编码和解码 |
JP7312826B2 (ja) * | 2018-11-26 | 2023-07-21 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | タイル独立性制約を使用したインター予測概念 |
US12022059B2 (en) * | 2018-12-07 | 2024-06-25 | Beijing Dajia Internet Information Technology Co., Ltd. | Video coding using multi-resolution reference picture management |
WO2020127110A1 (en) * | 2018-12-20 | 2020-06-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Signaling segment partitions in a parameter set |
MX2021012283A (es) | 2019-04-08 | 2022-01-18 | Lg Electronics Inc | Método y dispositivo de codificación basado en la partición de imágenes. |
WO2020209478A1 (ko) * | 2019-04-08 | 2020-10-15 | 엘지전자 주식회사 | 픽처를 복수의 타일들로 분할하는 방법 및 장치 |
WO2021087843A1 (en) * | 2019-11-07 | 2021-05-14 | Intel Corporation | Heterogeneous real-time streaming and decoding of ultra-high resolution video content |
CN111711818B (zh) * | 2020-05-13 | 2022-09-09 | 西安电子科技大学 | 视频图像编码传输方法及其装置 |
CN115278302A (zh) * | 2022-07-29 | 2022-11-01 | 腾讯科技(深圳)有限公司 | 直播流媒体数据处理方法、系统、装置和计算机设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6263023B1 (en) * | 1998-10-15 | 2001-07-17 | International Business Machines Corporation | High definition television decoder |
JP4418762B2 (ja) | 2004-05-07 | 2010-02-24 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
JP4592656B2 (ja) * | 2006-08-17 | 2010-12-01 | 富士通セミコンダクター株式会社 | 動き予測処理装置、画像符号化装置および画像復号化装置 |
US20100232504A1 (en) * | 2009-03-13 | 2010-09-16 | The State of Oregon acting by and through the State Board of Higher Education on behalf of the | Supporting region-of-interest cropping through constrained compression |
JP2011145572A (ja) * | 2010-01-18 | 2011-07-28 | Shicoh Engineering Co Ltd | スプリング、レンズ駆動装置、オートフォーカスカメラ及びカメラ付き携帯電話 |
US10244239B2 (en) * | 2010-12-28 | 2019-03-26 | Dolby Laboratories Licensing Corporation | Parameter set for picture segmentation |
BR112013020878B1 (pt) * | 2011-06-30 | 2022-05-10 | Mitsubishi Electric Corporation | Dispositivos e métodos de codificação e decodificação de imagem |
-
2012
- 2012-08-23 KR KR1020147000432A patent/KR101912485B1/ko active IP Right Grant
- 2012-08-23 JP JP2013555665A patent/JP6384650B2/ja active Active
- 2012-08-23 BR BR112014000368A patent/BR112014000368A2/pt not_active IP Right Cessation
- 2012-08-23 CN CN201280033779.6A patent/CN103650501B/zh active Active
- 2012-08-23 EP EP12826169.0A patent/EP2749029A4/en not_active Ceased
- 2012-08-23 WO PCT/JP2012/005289 patent/WO2013027407A1/en unknown
-
2014
- 2014-01-09 US US14/151,063 patent/US9225946B2/en active Active
Non-Patent Citations (2)
Title |
---|
Arild Fuldseth ET AL., Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 16-23 March, 2011, JCTVC-E408_r1* |
Ye-Kui Wang ET AL., Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) 5th Meeting: Geneva, CH, 9-17 October, 2002, JVT-E129* |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020175908A1 (ko) * | 2019-02-26 | 2020-09-03 | 엘지전자 주식회사 | 시그널링된 정보에 기반한 픽처 파티셔닝 방법 및 장치 |
US12041272B2 (en) | 2019-06-19 | 2024-07-16 | Electronics And Telecommunications Research Institute | Virtual boundary signaling method and apparatus for video encoding/decoding |
US12101485B2 (en) | 2019-12-24 | 2024-09-24 | Electronics And Telecommunications Research Institute | Image encoding/decoding method and device |
Also Published As
Publication number | Publication date |
---|---|
JP6384650B2 (ja) | 2018-09-05 |
EP2749029A1 (en) | 2014-07-02 |
CN103650501B (zh) | 2017-10-27 |
CN103650501A (zh) | 2014-03-19 |
BR112014000368A2 (pt) | 2017-02-14 |
US20140119671A1 (en) | 2014-05-01 |
US9225946B2 (en) | 2015-12-29 |
EP2749029A4 (en) | 2015-01-21 |
KR20140057238A (ko) | 2014-05-12 |
WO2013027407A1 (en) | 2013-02-28 |
JP2014527316A (ja) | 2014-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101912485B1 (ko) | 타일 부호화 스킴을 이용한 영상 부호화, 추출 및 복호화 방법 및 장치 | |
JP6473982B2 (ja) | 画像復号方法および画像復号装置 | |
KR102030205B1 (ko) | 시간 움직임 벡터 예측을 사용하여 비디오를 부호화 및 복호하는 방법 및 장치 | |
KR101815727B1 (ko) | 화상 부호화 방법 및 화상 부호화 장치 | |
CA2771433C (en) | Coding and decoding of stereoscopic images with base and enhancement layers | |
KR101944550B1 (ko) | 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치, 화상 복호화 장치 및 화상 부호화 복호화 장치 | |
CN108933943B (zh) | 图像编码方法及图像编码装置 | |
RU2625944C2 (ru) | Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений | |
KR101790401B1 (ko) | 주기적인 버퍼 기재를 사용하여 비디오를 부호화 및 복호하는 방법 및 장치 | |
WO2012160797A1 (en) | Methods and apparatuses for encoding and decoding video using inter-color-plane prediction | |
WO2013035313A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置 | |
JPWO2013111593A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 | |
KR102059060B1 (ko) | 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치, 화상 복호화 장치 및 화상 부호화 복호화 장치 | |
WO2012023281A1 (ja) | 動画像復号方法、動画像符号化方法、動画像復号装置、及び、動画像符号化装置 | |
KR20150013456A (ko) | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 및 부호화 복호 장치 | |
WO2012105265A1 (en) | Systems and methods for encoding and decoding video which support compatibility functionality to legacy video players | |
JP6414712B2 (ja) | 多数の参照ピクチャを用いる動画像符号化方法、動画像復号方法、動画像符号化装置、および動画像復号方法 | |
JP6483028B2 (ja) | 画像符号化方法及び画像符号化装置 | |
WO2013164903A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置 | |
WO2013014884A1 (ja) | 動画像符号化方法、動画像符号化装置、動画像復号化方法、および動画像復号化装置 | |
WO2015004884A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |