KR102076398B1 - 비디오 코딩 및 디코딩에서의 벡터 인코딩을 위한 방법 및 장치 - Google Patents
비디오 코딩 및 디코딩에서의 벡터 인코딩을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR102076398B1 KR102076398B1 KR1020177011152A KR20177011152A KR102076398B1 KR 102076398 B1 KR102076398 B1 KR 102076398B1 KR 1020177011152 A KR1020177011152 A KR 1020177011152A KR 20177011152 A KR20177011152 A KR 20177011152A KR 102076398 B1 KR102076398 B1 KR 102076398B1
- Authority
- KR
- South Korea
- Prior art keywords
- block
- coding tree
- blocks
- image
- processed
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 239000013598 vector Substances 0.000 title description 44
- 230000008569 process Effects 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 21
- 230000001360 synchronised effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000001364 causal effect Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000001934 delay Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/40—Tree coding, e.g. quadtree, octree
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 비디오를 인코딩 또는 디코딩하는 프로세스에서 픽셀들의 블록들을 인코딩 또는 디코딩하기 위한 방법 및 디바이스에 관한 것이다. 그것은 HEVC 스크린 내용 확장의 INTRA 블록 복사 모드를 이용할 때 병렬화를 다루기 위한 방법에 특히 관련되어 있다. 그것은 INTRA 블록 복사 모드에서 예측자 블록을 제공하기 위해 이용 가능한 영역의 제어를 기반으로 한다. 따라서, 구현은 병렬화된 프로세스를 허용하기 위해서 간단하다.
Description
본 발명은 비디오를 인코딩 또는 디코딩하는 프로세스에서 픽셀들의 블록들을 인코딩 또는 디코딩하기 위한 방법 및 장치에 관한 것이다. 그것은 HEVC 스크린 내용 확장의 INTRA 블록 복사 모드를 이용할 때 병렬화를 다루기 위한 방법에 특히 관련되어 있다. 그것은 INTRA 블록 복사 모드에서 예측자 블록을 제공하기 위해 이용 가능한 영역의 제어를 기반으로 한다.
특히, 픽셀의 블록이 동일한 이미지에 관한 예측자 블록에 기초하여 예측적으로 인코딩되는 코딩의 모드에 적용된다. 픽셀의 블록을 인코딩하는 이러한 모드는 일반적으로 INTRA 블록 복사 모드로서 지칭된다. 그것은 고효율 비디오 코딩(HEVC: ISO/IEC 23008-2 MPEG-H Part 2/ITU-T H.265) 국제 표준의 스크린 내용 확장 및 지금 여기서는 동일한 것의 스크린 내용 확장을 위한 도구 후보로서 간주된다.
비디오 시퀀스에서 이미지를 인코딩할 때, 이미지는 먼저, 코딩 트리 블록(CTB: Coding Tree Block)으로 지칭된 동일 사이즈의 픽셀들의 엔티티들인 코딩 요소들로 분할된다. 코딩 트리 블록의 사이즈는 일반적으로 64 × 64 픽셀이다. 각각의 코딩 트리 블록은 그리고 나서 사이즈가 변할 수 있고 인코딩하기 위한 실제 블록인 더 작은 블록의 계층적 트리로 분해될 수 있다. 인코딩하기 위한 이러한 작은 블록들은 코딩 유닛(CU: Coding Unit)으로서 지칭된다.
특정 코딩 유닛의 인코딩은 일반적으로 예측된다. 이것은 예측자 블록이 먼저 결정되는 것을 의미한다. 다음에, 예측자 블록과 코딩 유닛 간의 차이가 계산된다. 이러한 차이는 잔차(residual)로 불리운다. 다음에, 이러한 잔차는 압축된다. 코딩 유닛의 실제 인코딩된 정보는 예측자 블록 및 압축된 잔차를 결정하는 방식을 나타내기 위해 일부 정보로 만들어진다. 최상의 예측자 블록들은, 효율적으로 압축될 수 있는 작은 잔차를 취득하기 위해서 가능한 한 코딩 유닛과 유사한 블록들이다.
인코딩은 손실될 수 있으며, 이는 정보가 인코딩 프로세스에서 손실되는 것을 의미한다. 픽셀의 디코딩된 블록은 원래의 코딩 유닛과 정확히 동일하지는 않다. 일반적으로, 정보의 손실은 엔트로피 코딩 전에 잔차에 적용된 양자화로부터 유래한다. 이러한 양자화는 정확도의 손실을 희생하여 더 높은 압축 비율을 허용한다. 일반적으로, 고주파, 즉 높은 레벨의 상세(details)가 블록에서 제거된다.
인코딩은 손실되지 않을 수 있으며, 이는 잔차가 양자화되지 않는다는 것을 의미한다. 이러한 종류의 인코딩은 코딩 유닛의 원래의 샘플의 정확한 복사를 서치하는 것을 허용한다. 무손실 인코딩은 손실 압축에 비해 훨씬 작은 압축률을 희생하여 취득된다.
코딩 모드는 코딩 유닛의 예측 인코딩 방법을 위한 예측자 블록을 결정하는 데 사용되는 방법에 기초하여 정의된다.
제1 코딩 모드는 INTRA 모드로서 지칭된다. INTRA 모드에 따르면, 예측자 블록은 현재 이미지 내의 코딩 유닛의 바로 근처의 픽셀들의 값에 기초하여 구축된다. 예측자 블록이 현재 이미지의 블록이 아니라 재구성이라는 점에 유의해야 한다. 방향은, 경계의 어느 픽셀들이 예측자 블록을 구축하는 데 실제 사용되고 어떻게 이들이 사용되는 지를 결정하기 위해 이용된다. INTRA 모드에 숨겨진 아이디어는, 자연적 이미지들의 일반적 코히런스(general coherence) 때문에, 코딩 유닛의 바로 근처의 픽셀들이 현재의 코딩 유닛의 픽셀들과 유사할 가능성이 있다는 것이다. 따라서, 이들 근처 픽셀들에 기초하는 예측자 블록을 이용하여 코딩 유닛의 픽셀들의 값의 양호한 예측을 취득하는 것이 가능하다.
제2 코딩 모드는 INTER 모드로서 지칭된다. INTER 모드에 따르면, 예측자 블록은 또 다른 이미지의 블록이다. INTER 모드에 숨겨진 아이디어는 시퀀스 내의 연속적인 이미지들이 일반적으로 매우 유사하다는 것이다. 주된 차이는 전형적으로 카메라의 스크롤링에 기인하거나 장면 내의 이동하는 객체들에 기인하는 이들 이미지 간의 모션으로부터 유래한다. 예측자 블록은 현재 이미지 내의 코딩 유닛의 위치에 대해 상대적으로 참조 이미지에 그 위치를 제공하는 벡터에 의해 결정된다. 이러한 벡터는 모션 벡터로서 지칭된다. 이러한 모드에 따르면, 이러한 모드를 이용하는 그런 코딩 유닛의 인코딩은 모션 벡터 및 압축된 잔차를 포함하는 모션 정보를 포함한다.
이러한 문서에서는 INTRA 블록 복사 모드로 불리는 제3 코딩 모드에 집중한다. INTRA 블록 복사 모드에 따르면, 블록 예측자는 현재 이미지의 실제 블록이다. 블록 벡터는 예측자 블록을 위치시키는데 사용된다. 이러한 블록 벡터는 동일한 현재 이미지에서 코딩 유닛의 위치에 대해 상대적으로 예측자 블록의 현재 이미지에 위치를 제공한다. 이러한 블록 벡터는 INTER 모드의 모션 벡터와 몇가지 유사점을 공유하게 된다. 그것은 언젠가 비유하여 모션 벡터로 불린다. 엄밀히 말하자면, 그리고 명확성을 위해, 이미지 내에서 모션이 없기 때문에, 이 문서에서는 모션 벡터가 항상 INTER 모드를 참조하는 반면 블록 벡터는 INTRA 블록 복사 모드에 사용된다.
인과성 원리는 특정 코딩 유닛을 디코딩하기 위한 모든 정보가 이미 재구성된 코딩 유닛을 기반으로 해야 한다는 것을 진술하는 원리다. 인코딩에서, 전체 정보는 이용 가능한 것으로서 간주될 수 있다. 즉, 주어진 코딩 유닛을 인코딩하기 위해서는, 시퀀스에서 전체 현재 이미지로부터 또는 모든 디코딩된 이용 가능한 다른 이미지로부터 임의의 정보를 이용하는 것이 가능할 것이다. 디코딩에서, 상황들은 상이하다. 현재 이미지의 디코딩은 일반적으로 모든 코딩 유닛을 순차 디코딩함으로써 행해진다. 디코딩의 순서는 일반적으로 래스터 스캔 순서, 즉 이미지의 상부 좌측에서 시작하고, 좌측에서 우측으로 및 상부에서 하부로 진행하는 것을 따른다. 그것은 주어진 코딩 유닛을 디코딩할 때, 현재의 코딩 유닛에 대해 상부 또는 좌측에 위치한 현재 이미지의 부분만이 이미 디코딩되었다. 이것은 단지, 현재의 코딩 유닛의 디코딩을 위한 이용 가능한 정보이다. 이것은 인코딩에서 고려되어야 한다. 예를 들어, INTRA 블록 복사 모드의 예측자 블록은 디코딩에서 이용 가능하게 되는 이미지의 부분과 관련되어야 한다.
디코딩에서, INTRA 블록 복사 모드를 이용하여 인코딩된 블록을 서치하기 위해서, 가장 먼저, 블록 벡터를 이용하여 예측자 블록이 결정된다. 그리고 나서 잔차가 디코딩되고 예측자에 적용되어 원시의 재구성된 블록을 취득한다.
완전한 이미지가 재구성되었을 때, 일부 포스트 필터링이 적용된다. 일반적으로 제1 필터는 블록 인코딩 때문에 재구성된 이미지에서 일부 아티팩트를 제거하기 위해 적용된다. 이러한 필터는 디블로킹 필터로 불린다. 일반적으로, 필수적이지는 않지만, 샘플 적응 루프 필터(SAO)는 그리고 나서 마지막 이미지를 취득하기 위해 적용된다.
일부 디코딩 아키텍처에서, 처리는 프로세스를 가속하기 위해서 병렬화된다. 이러한 상황에서, 특정 코딩 트리 블록은 예를 들어 이전의 것이 필터링되는 동안 재구성된다. 즉, 일부 코딩 트리 블록의 재구성 및 다른 것의 필터링은 병렬로 이루어진다.
HEVC 표준은 프레임 병렬성을 위한 파면(Wavefront) 또는 타일 또는 슬라이스 및 내부 병렬성을 위한 유연한 참조 프레임 관리로서의 다소 높은 레벨의 병렬성을 제공한다. 이들 도구는 필수적이지는 않지만, 아직, 디코더는 그들이 필수적이지는 않더라도 그들의 관련된 구문을 디코딩할 필요가 있다.
본 명세서에서는 파면 병렬 처리 및 그것이 특정 코딩 유닛을 인코딩하는 INTRA 블록 복사 모드와 어떻게 효율적으로 결합되는 지에 대해 집중한다
파면 병렬 처리는 코딩 트리 블록의 라인들의 재구성을 병렬화하는 것을 기반으로 하고 있다. 즉, 수많은 코딩 트리 블록은 병렬로 재구성된다. 코딩 트리 블록의 후속 라인의 재구성이 이전의 라인으로부터 일부 정보를 필요로 하는 사실 때문에 각각의 라인의 처리 사이에 지연이 도입된다. 그것은 병렬화되는 상이한 라인들의 재구성이 각각의 라인 사이의 지연을 이용하여 진행되고 있다는 것을 의미한다.
이러한 파면 병렬 처리는 INTRA 블록 복사 모드에 따라 인코딩된 특정 코딩 유닛을 재구성할 때 문제를 가지고 있다는 것을 증명할 수 있다. 실제로, INTRA 블록 복사 모드에 따른 인코딩된 코딩 유닛을 위한 블록 예측자는, 완전한 인과성 영역, 즉 이전의 코딩 트리 블록 라인 및 현재의 라인 내의 이전의 코딩 트리 블록에서 어딘가에 위치할 수 있다. 이전의 라인들이 고려된 것과 병렬로 재구성되기 때문에, 그것이 INTRA 블록 복사 모드에 따라 인코딩된 코딩 유닛의 재구성에 필요할 때 예측자 블록이 아직 재구성되지 않을 수도 있다. 이와 같이 INTRA 블록 복사 모드는 파면 병렬 재구성과 완전히 호환적이지 않다.
본 발명은 상기 관심사들 중 하나 이상을 다루도록 고안되었다.
본 발명의 제1 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 그러한 하나의 모드는 상기 블록이 현재 이미지의 블록인 예측자 블록을 기반으로 인코딩되는 모드이며, 상기 방법은, 상기 하나의 모드에 대한 서치 영역을, 이하의 좌표(X, Y)들을 갖는 코딩 트리 블록들과 현재의 코딩 트리 블록의 임의의 재구성된 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다.
일 실시예에서 인코딩은 파면 병렬 처리를 이용하여 수행된다.
본 발명의 제2 양태에 있어서, 이미지를 디코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 그러한 하나의 모드는 상기 블록이 현재 이미지의 블록인 예측자 블록을 기반으로 디코딩되는 모드이며, 상기 방법은, 상기 예측자 블록이 상기 하나의 모드에 대해 취득될 수 있는 영역을, 이하의 좌표(X, Y)들을 갖는 코딩 트리 블록들과 현재의 코딩 트리 블록의 임의의 재구성된 블록들에 의해 구성된 영역으로 제한하는 단계를 포함하며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다.
일 실시예에서 디코딩은 파면 병렬 처리를 이용하여 수행된다.
본 발명의 제3 양태에 있어서, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 그러한 하나의 모드는 상기 블록이 현재 이미지의 블록인 예측자 블록을 기반으로 인코딩되는 모드이며, 상기 장치는, 상기 하나의 모드에 대한 서치 영역을, 이하의 좌표(X, Y)들을 갖는 코딩 트리 블록들과 현재의 코딩 트리 블록의 임의의 재구성된 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다.
본 발명의 제4 양태에 있어서, 이미지를 디코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 디코딩되고, 그러한 하나의 모드는 상기 블록이 현재 이미지의 블록인 예측자 블록을 기반으로 디코딩되는 모드이며, 상기 장치는, 상기 예측자 블록이 취득될 수 있는 영역을, 이하의 좌표(X, Y)들의 코딩 트리 블록들과 현재의 코딩 트리 블록의 재구성된 블록들에 의해 구성된 영역으로 제한하는 수단을 포함하며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다. 예를 들어, 영역을 제한하는 것은, 예측자 블록이 취득되는 영역이, 이하의 좌표(X, Y)들의 코딩 트리 블록들과 현재의 코딩 트리 블록의 재구성된 블록들에 의해 구성된 영역 외부에 있는 것으로 발견되는 경우 디코딩 프로세스를 실행하지 않는(예를 들어, 멈추는) 형태를 취할 수 있고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다.
본 발명의 제5 양태에 있어서, 이미지를 인코딩 및 디코딩하기 위한 시스템이 제공되고, 상기 시스템은 선행하는 인코더 양태들에 따라 이미지를 인코딩하기 위한 장치 및 선행하는 디코더 양태들에 따라 이미지를 디코딩하기 위한 장치를 포함한다.
인코딩을 위한 장치 및 디코딩을 위한 장치는 파면 병렬 처리를 이용하도록 구성될 수 있다.
인코딩을 위한 장치 및 디코딩을 위한 장치는 이미지를 각각 인코딩 및 디코딩하기 위한 동일한 수의 동기화된 스레드를 이용하도록 구성될 수 있다.
본 발명의 제6 양태에 따르면, 인코딩된 이미지들을 포함하는 비트스트림이 제공되고, 여기에서 인코딩된 이미지들은 선행하는 인코딩 양태들에 따라 인코딩되었다.
본 발명의 제7 양태에 따르면, 이미지들의 인코딩된 시퀀스를 포함하는 비트스트림이 제공되고, 상기 이미지들은 각각, 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되었고, 하나의 모드는 상기 블록이 현재 이미지의 블록인 예측자 블록을 기반으로 인코딩되는 모드이며, 여기에서 비트스트림에 의해 나타내진 임의의 예측자 블록의 위치가 이하의 좌표(X, Y)들을 갖는 코딩 트리 블록들과 현재의 코딩 트리 블록의 임의의 재구성된 블록들에 의해 구성된 영역으로 제한되며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 인코딩된 이미지의 상부 좌측 모서리에 있고, (X0, Y0)은 현재의 코딩 트리 블록의 좌표들이다.
본 발명의 제8 양태에 따르면, 선행하는 비트스트림 양태에 따른 비트스트림을 저장한 머신 판독가능 캐리어 또는 저장 매체가 제공된다. 캐리어는 또한 상기 비트스트림이 구체화된 신호일 수 있다.
본 발명의 제9 양태에 따르면, 프로그래밍 가능 장치를 위한 컴퓨터 프로그램 제품이 제공되며, 상기 컴퓨터 프로그램 제품은, 프로그래밍 가능 장치에 로딩되고 이에 의해 실행될 때, 선행하는 방법 양태들 중 어느 하나에 따른 방법을 구현하기 위한 명령어들의 시퀀스를 포함한다.
본 발명의 제10 양태에 따르면, 선행하는 방법 양태의 어느 하나에 따른 방법을 구현하기 위한 컴퓨터 프로그램의 명령어들을 저장하는 컴퓨터-판독가능 저장 매체가 제공된다.
본 발명의 추가적인 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 방법은, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하고,
Y≤Y0 및 X≤X0 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
따라서, 구현은 파면 프로세스를 허용하기 위해서 간단하다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 방법은, INTRA 블록 복사 모드에 대한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하며,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
따라서, 서치 영역은 더 크고, 이는 양호한 인코딩으로 이어진다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 방법은, INTRA 블록 복사 모드에 대한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하며,
Y≤Y0 및 (X-X0) ≤-2 * (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
따라서, 서치 영역은 더 크고, 이는 양호한 인코딩으로 이어진다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록들을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 방법은, INTRA 블록 복사 모드에 대한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하며,
Y≤Y0 및 (X-X0) <- 2 * (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
따라서, 구현은 더 간단하다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 방법은, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 단계를 포함하고,
X≤X0 및 Y = Y0 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 인코딩은 인코딩의 복수의 병렬 스레드에 의해 수행되며, 각각의 스레드는 코딩 트리 블록들의 라인의 인코딩에 전용되고, 상기 방법은, INTRA 블록 복사 모드에 대한 서치 범위를, 현재의 INTRA 블록 복사 블록에 대해, 이전의 코딩 블록 블록 라인들과 현재의 코딩 트리 블록 라인의 모든 스레드들에 의해 재구성된 모든 데이터에 의해 구성된 영역으로서 결정하는 단계를 포함한다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 인코딩은 인코딩의 복수의 동기화된 병렬 스레드에 의해 수행되며, 각각의 스레드는 코딩 트리 블록들의 라인의 인코딩에 전용되고, 상기 방법은, INTRA 블록 복사 모드에 대한 서치 범위를, 현재의 INTRA 블록 복사 블록에 대해, 모든 스레드들(현재의 코딩 트리 블록을 포함)에 의해 재구성된 모든 데이터에 의해 구성된 영역으로서 결정하는 단계를 포함한다.
일 실시예에서, 인코딩은 파면 병렬화된 모드에 따라 행해진다.
본 발명의 또 다른 양태에 따르면, 이미지를 디코딩하는 방법이 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 디코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 디코딩은 디코딩의 복수의 병렬 스레드에 의해 수행되며, 각각의 스레드는 코딩 트리 블록들의 라인의 디코딩에 전용되고, 여기서 상기 복수의 스레드는 동기화된다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하고,
Y≤Y0 및 X≤X0 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하고,
Y≤Y0 및 (X-X0) ≤-2 * (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 하부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하고,
Y≤Y0 및 (X-X0) <- 2 * (Y-Y0) 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, INTRA 블록 복사 모드를 위한 서치 범위를, 다음과 같은 좌표(X, Y)들의 코딩 트리 블록들에 의해 구성된 영역으로서 결정하는 수단을 포함하고,
X≤X0 및 Y = Y0 이며,
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 재구성된 블록들 외에, 현재 코딩 트리 블록의 좌표들이다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 인코딩은 인코딩의 복수의 병렬 스레드에 의해 수행되며, 각각의 스레드는 코딩 트리 블록들의 라인의 인코딩에 전용되고, 상기 장치는, INTRA 블록 복사 모드에 대한 서치 범위를, 현재의 INTRA 블록 복사 블록에 대해, 이전의 코딩 블록 블록 라인들과 현재의 코딩 트리 블록 라인의 모든 스레드들에 의해 재구성된 모든 데이터에 의해 구성된 영역으로서 결정하는 수단을 포함한다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 인코딩은 인코딩의 복수의 동기화된 병렬 스레드에 의해 수행되며, 각각의 스레드는 코딩 트리 블록들의 라인의 인코딩에 전용되고, 상기 장치는, INTRA 블록 복사 모드에 대한 서치 범위를, 현재의 INTRA 블록 복사 블록에 대해, 모든 스레드들에 의해 재구성된 모든 데이터에 의해 구성된 영역으로서 결정하는 수단을 포함한다.
본 발명의 또 다른 양태에 따르면, 이미지를 디코딩하는 장치가 제공되고, 상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 디코딩되고, 하나의 모드는 상기 블록이 현재 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 INTRA 블록 복사 모드로 불리우고, 상기 장치는, 디코딩의 복수의 병렬 스레드를 처리하는 수단을 포함하고, 각각의 스레드는 코딩 트리 블록들의 라인의 디코딩에 전용되고; 상기 복수의 스레드를 동기화하는 동기화 수단을 포함한다.
본 발명의 또 다른 양태에 따르면, 이미지를 인코딩 및 디코딩하는 시스템이 제공되고, 상기 시스템은 본 발명에 따른 인코더 및 본 방법에 따른 디코더를 포함한다.
일 실시예에서, 인코더 및 디코더는 이미지를 각각 인코딩 및 디코딩하기 위한 동일한 수의 동기화된 스레드를 이용한다.
본 발명의 또 다른 양태에 따르면, 인코딩된 이미지들을 포함하는 비트스트림이 제공되고, 여기에서 인코딩된 이미지들은 본 발명에 따라 인코딩되었다.
본 발명의 또 다른 양태에 따르면, 프로그래밍 가능 장치를 위한 컴퓨터 프로그램 제품이 제공되며, 컴퓨터 프로그램 제품은 프로그래밍 가능 장치에 로딩되고 이에 의해 실행될 때, 본 발명에 따른 방법을 구현하기 위한 명령어들의 시퀀스를 포함한다.
본 발명의 또 다른 양태에 따르면, 본 발명에 따른 방법을 구현하기 위한 컴퓨터 프로그램의 명령어들을 저장하는 컴퓨터 판독가능 저장 매체가 제공된다.
상술한 본 발명의 일부 양태들은, 복수의 모드 중 인트라 블록 복사 모드인 모드를 언급하지만, 이해될 수 있는 바와 같이, 이는 단지 이러한 모드에 대한 임의의 라벨이며 제한하려는 의도는 아니다. 따라서, 이러한 양태들은 의도된 범위 내에서, 모드가 인트라 블록 복사 모드 또는 다른 것으로 언급되는지 여부에 따라, 인코딩(또는 디코딩)되는 현재의 이미지의 실제 블록인 예측자 블록을 기반으로 블록이 인코딩(또는 디코딩)되는 임의의 모드를 갖는다.
본 발명에 따른 방법의 적어도 일부는 컴퓨터로 구현될 수 있다. 따라서, 본 발명은 완전 하드웨어 실시예, 완전 소프트웨어 실시예(펌웨어, 상주 소프트웨어, 마이크로-코드 등을 포함) 또는 일반적으로 모두가 여기서 "회로", "모듈" 또는 "시스템"으로 칭해질 수 있는 소프트웨어 및 하드웨어 양태들을 결합하는 실시예의 형태를 취할 수 있다. 또한, 본 발명은 매체에 구체화된 컴퓨터 이용 가능 프로그램 코드를 갖는 임의의 유형의 표현 매체에 구현된 컴퓨터 프로그램 제품의 형태를 취할 수 있다.
본 발명은 소프트웨어로 구현될 수 있으므로, 본 발명은 임의의 적절한 캐리어 매체 상의 프로그래밍 가능 장치에 제공하기 위한 컴퓨터 판독 가능 코드로서 구현될 수 있다. 유형의 캐리어 매체는 플로피 디스크, CD-ROM, 하드 디스크 드라이브, 자기 테이프 장치 또는 고체 상태 메모리 장치 등과 같은 저장 매체를 포함할 수 있다. 일시적인 캐리어 매체는 전기 신호, 전자 신호, 광 신호, 음향 신호, 자기 신호 또는 전자기 신호, 예를 들어 마이크로웨이브 또는 RF 신호와 같은 신호를 포함할 수 있다.
이제 본 발명의 실시예는 이하 도면을 참조하여 예로서만 설명될 것이다:
도 1은 HEVC 인코더 아키텍처를 설명한다;
도 2는 HEVC 디코더 아키텍처를 설명한다;
도 3은 비디오 프레임의 레벨 분해를 설명한다;
도 4는 파면 처리의 원리를 설명한다;
도 5는 파면을 가진 컨텍스트 변수의 초기화를 위한 블록의 위치를 설명한다;
도 6은 인과성 영역의 개념을 설명한다;
도 7은 INTRA 블록 복사 서치 영역을 설명한다;
도 8은 본 발명에 의해 해결된 문제를 설명한다;
도 9는 본 발명의 일 실시예를 설명한다;
도 10은 본 발명의 일 실시예를 설명한다;
도 11은 본 발명의 일 실시예를 설명한다;
도 12는 본 발명의 일 실시예를 설명한다;
도 13은 본 발명의 일 실시예를 설명한다;
도 14는 본 발명의 하나 이상의 실시예들의 구현을 위한 컴퓨팅 장치의 개략 블록도이다.
도 1은 HEVC 인코더 아키텍처를 설명한다;
도 2는 HEVC 디코더 아키텍처를 설명한다;
도 3은 비디오 프레임의 레벨 분해를 설명한다;
도 4는 파면 처리의 원리를 설명한다;
도 5는 파면을 가진 컨텍스트 변수의 초기화를 위한 블록의 위치를 설명한다;
도 6은 인과성 영역의 개념을 설명한다;
도 7은 INTRA 블록 복사 서치 영역을 설명한다;
도 8은 본 발명에 의해 해결된 문제를 설명한다;
도 9는 본 발명의 일 실시예를 설명한다;
도 10은 본 발명의 일 실시예를 설명한다;
도 11은 본 발명의 일 실시예를 설명한다;
도 12는 본 발명의 일 실시예를 설명한다;
도 13은 본 발명의 일 실시예를 설명한다;
도 14는 본 발명의 하나 이상의 실시예들의 구현을 위한 컴퓨팅 장치의 개략 블록도이다.
도 1은 HEVC 인코더 아키텍처를 설명한다. 비디오 인코더에서, 원래의 시퀀스(101)는 픽셀들의 블록들로 분할된다(102). 그리고 나서 각각의 블록에 코딩 모드가 영향을 미친다. 일반적으로 HEVC에 사용된 코딩 모드의 2개의 패밀리가 있다: 공간 예측 또는 INTRA 모드(103)들을 기반으로 하는 모드들 및 시간 예측을 기반으로 하는 모드들 또는 모션 추정(104)과 모션 보상(105)을 기반으로 하는 INTER 모드들. INTRA 코딩 유닛은 일반적으로 INTRA 예측으로 불리는 프로세스에 의해 그 인과성 경계에서 인코딩된 픽셀들로부터 예측된다.
시간 예측은 먼저, 참조 프레임(116)으로 불리는 이전의 또는 미래의 프레임에서, 모션 추정 단계(104)에서 코딩 유닛과 가장 가깝게 매칭하는 참조 영역을 발견하는 것을 포함한다. 이러한 참조 영역은 예측자 블록을 구성한다. 다음에, 이러한 코딩 유닛은 모션 보상 단계(105)에서 잔차를 계산하기 위해 예측자 블록을 이용하여 예측된다.
공간 및 시간 예측의 둘 다의 경우에, 잔차는 원래의 예측자 블록으로부터 코딩 유닛을 차감하여 계산된다.
INTRA 예측에서는, 예측 방향이 인코딩된다. 시간 예측에서는, 적어도 하나의 모션 벡터가 인코딩된다. 그러나, 모션 벡터 인코딩과 관련된 비트레이트 코스트를 더 감소시키기 위해서, 모션 벡터는 직접 인코딩되지 않는다. 사실상, 모션이 동종이라고 가정하면, 이러한 모션 벡터와 그 주위의 모션 벡터 간의 차이로서 모션 벡터를 인코딩하는 것에 특히 관심이 있다. 예를 들어, H.264/AVC 코딩 표준에서, 모션 벡터들은 현재 블록의 상부 및 좌측에 위치한 3개의 블록들 사이에서 계산된 중간 벡터에 대해 인코딩된다. 중간 벡터와 현재 블록 모션 벡터 사이에서 계산된, 잔차 모션 벡터(residual motion vector)로도 불리는 차이만이 비트스트림으로 인코딩된다. 이것은 모듈 "Mv 예측 및 코딩"(117)에서 처리된다. 각각의 인코딩된 벡터의 값은 모션 벡터 필드(118)에 저장된다. 예측에 사용된 인접 모션 벡터들은 모션 벡터 필드(118)로부터 추출된다.
다음에, 레이트 왜곡 성능을 최적화하는 모드가 모듈(106)에서 선택된다. 중복성을 더 감소시키기 위해서, 변환, 전형적으로 DCT가 모듈(107)에서 잔차 블록에 적용되고, 양자화는 모듈(108)에서 계수들에 적용된다. 계수들의 양자화된 블록은 그 다음 모듈(109)에서 엔트로피 코딩되고, 그 결과는 비트스트림(110)에 삽입된다.
인코더는 그 다음 모듈들(111 내지 116)에서 미래의 모션 추정을 위한 인코딩된 프레임의 디코딩을 수행한다. 이러한 단계들은 인코더 및 디코더가 동일한 참조 프레임들을 가지게 할 수 있다. 코딩된 프레임을 재구성하기 위해, 잔차는 픽셀 도메인에서 "재구성된" 잔차를 제공하기 위해서 모듈(111)에서 역 양자화되고 모듈(112)에서 역 변환된다. 인코딩 모드(INTER 또는 INTRA)에 따르면, 이러한 잔차는 INTER 예측자(114) 또는 INTRA 예측자(113)에 추가된다.
다음에, 이러한 제1 재구성은 하나 또는 여러 종류의 포스트 필터링에 의해 모듈(115)에서 필터링된다. 이들 포스트 필터들은 인코딩된 및 디코딩된 루프에 통합된다. 이것은 그들이 인코더 및 디코더 측에서 동일한 참조 프레임을 이용하기 위해서 인코더 및 디코더 측에서 재구성된 프레임에 적용될 필요가 있다는 것을 의미한다. 이러한 포스트 필터링의 목표는 압축 아티팩트를 제거하는 것이다.
도 2에서, 디코더의 원리를 나타냈다. 비디오 스트림(201)은 모듈에서 제1 엔트로피 디코딩된다(202). 잔차 데이터는 이후 픽셀 값들을 취득하기 위해 모듈에서 역 양자화되고(203) 모듈에서 역 변환된다(204). 모드 데이터는 또한 모드의 기능에서 엔트로피 디코딩되고, INTRA 타입 디코딩 또는 INTER 타입 디코딩이 수행된다. INTRA 모드의 경우에, INTRA 예측자는 비트스트림에 특정된 INTRA 예측 모드의 기능에서 결정된다(205). 모드가 INTER이면, 모션 정보는 비트스트림으로부터 추출된다(202). 이것은 참조 프레임 인덱스 및 모션 벡터 잔차로 이루어져 있다. 모션 벡터 예측자는 모션 벡터를 취득하기 위해 모션 벡터 잔차에 추가된다(210). 모션 벡터는 이후 참조 영역을 참조 프레임에 배치하기 위해 사용된다(206). 모션 벡터 필드 데이터(211)는 다음 디코딩된 모션 벡터들의 예측에 사용되도록 하기 위해서 디코딩된 모션 벡터를 이용하여 업데이트되는 것에 유의한다. 디코딩된 프레임의 이러한 제1 재구성은 이후 인코더 측에서 이용된 것과 정확히 동일한 포스트 필터를 이용하여 포스트 필터링(207)된다. 디코더의 출력은 압축 해제된 비디오(209)이다.
이러한 INTRA 블록 복사 코딩 모드는 매우 반복적 패턴에 특히 적합하다. 특히, 이것은 글리프(glyphs)와 같은 코딩 그래픽 요소들, 문자의 그래픽 표현, 또는 전통적인 GUI 요소들을 코딩하는 데 도움이 되는 것으로 알려져 있는데, 이들은 전통적인 INTRA 예측 방법을 사용하여 코딩하기가 매우 어렵다.
예측은 인접하는 코딩 유닛들 간의 코히런스를 기반으로 한다는 것은 주목할 만한다. 이러한 코히런스는 현재 프레임 내에서 고려될 때 지리적이고 또는 연속 프레임에 걸쳐 고려될 때 일시적일 수 있다. 이러한 종류의 코히런스는 자연적 이미지에서 발생한다. INTRA 블록 복사 인코딩 모드가 텍스트 또는 기호 이미지에 전용된 모드로서 보여진 것처럼, 이러한 종류의 이미지에는 예측이 쓸모없는 것으로 간주된다. 예를 들어, 서로 가까운 양호한 예측자들을 갖는 텍스트를 나타내는 이미지에서 2개의 연속적인 코딩 유닛을 가질 이유가 없다. 제1 코딩 유닛은 문자 "A"의 일부일 수 있으므로, 양호한 예측자 블록은 텍스트의 또 다른 "A"로부터 유래한다. 반면에, 다음의 코딩 유닛은 텍스트의 또 다른 "P"로부터 예측자 블록을 갖는 "P"문자이다. 선험적으로, 동일한 이웃에는 2개의 예측자 블록을 포함할 필요는 없다. 이것은 선행 기술이 INTRA 블록 복사 인코딩 모드에서 예측을 도입하는 것을 고려하지 않는 이유이다.
HEVC에서, 소위 상이한 타입의 SEI 메시지들로 불리우는 특정한 NAL 유닛들을 전송하는 것이 가능하다. SEI 메시지들은 디스플레이 프로세스와 관련된 정보를 포함하고, 따라서 선택적이다.
도 3은 HEVC에 사용된 코딩 구조를 보여준다. HEVC 및 그것의 이전의 선행자(predecessor) 중의 하나에 따르면, 오리지널 비디오 시퀀스(301)는 일련의 디지털 이미지 "images i"이다. 본 기술분야의 통상의 기술자에 의해 알려진 것처럼, 디지털 이미지는 그것의 계수가 픽셀을 나타내는 하나 이상의 행렬들에 의해 표시된다.
이미지(302)들은 슬라이스(303)들로 분할된다. 슬라이스는 이미지의 일부 또는 전체 이미지이다. HEVC에서, 이들 슬라이스는 일반적으로 사이즈 64 픽셀 × 64 픽셀의 블록들인 비-중첩 코딩 트리 블록(CTB)(304)들로 분할된다. 각각의 코딩 트리 블록은 차례로 쿼드 트리 분해를 이용하여 더 작은 가변 크기 코딩 유닛(CU)(305)들로 반복적으로 분할될 수 있다. 코딩 유닛들은 기본적인 코딩 요소들이며 예측 유닛(PU) 및 변환 유닛 (TU)의 최대 사이즈가 코딩 유닛의 사이즈와 같은 2개의 서브 유닛들로 구성된다. 예측 유닛은 픽셀들 값들의 예측을 위한 코딩 유닛의 분할에 대응한다. 각각의 코딩 유닛은 최대 4 평방 파티션 유닛들 또는 2 직사각형 파티션 유닛들로 추가로 파티션될 수 있다(306). 변환 유닛들은 DCT로 공간적으로 변환되는 기본적인 유닛들을 나타내는데 사용된다. 코딩 유닛은 쿼드 트리 표현을 기반으로 TU에서 파티션될 수 있다(307).
각각의 슬라이스는 하나의 NAL 유닛 내에 임베드된다. 또한, 비디오 시퀀스의 코딩 파라미터들은 파라미터 세트들로 불리는 전용 NAL 유닛들에 저장된다. HEVC 및 H.264/AVC에서, 2 종류의 파라미터 세트 NAL 유닛들이 사용된다: 첫째로, 전체 비디오 시퀀스 동안에 변하지 않은 모든 파라미터들을 모은 시퀀스 파라미터 세트(SPS) NAL 유닛. 통상적으로, 이는 코딩 프로파일, 비디오 프레임들의 사이즈 및 기타의 파라미터들을 취급한다. 둘째로, 픽처 파라미터 세트(PPS)는 하나 프레임에서 또 다른 프레임으로 변할 수 있는 상이한 값들을 코딩한다. HEVC는 스트림의 전체 구조를 기술하는 파라미터를 포함하는 비디오 파라미터 세트(VPS)를 또한 포함한다.
실시간 또는 빠른 구현을 위해, 종종 일부 인코딩 및 디코딩 프로세스들을 병렬화할 필요가 있다. HEVC 표준은 프레임 병렬성을 위한 파면 또는 타일들 또는 슬라이스들 및 내부 병렬성을 위한 유연한 참조 프레임 관리로서 다소 높은 레벨의 병렬성을 제공한다. 이들 도구들은 아직 필수적이지는 않고, 그들이 필수적이지는 않더라도 디코더는 그들의 관련된 구문을 디코딩할 필요가 있다.
본 발명은 그것이 HEVC의 스크린 내용 확장의 INTRA 블록 복사 도구들에 결합될 때 파면 처리에 전용된다. 파면 처리의 원리는 도 4에 나타난다. 원리는 코딩 트리 블록의 여러 라인들의 디코딩 프로세스를 병렬화하는 것이다. 타일들과는 반대로 또는 전통적인 슬라이스들에서, 이들은 일부 예측을 회피하여, 병렬성을 제공하지만, 코딩 효율의 일부 손실을 발생시키고 파면은 대부분의 예측을 유지한다. 파면은 병렬화를 위한 각각의 라인 사이에 지연을 도입한다. 도 4의 예에서, 4개의 스레드는 병렬로 구동된다. 그래서, 4개의 현재의 코딩 트리 블록은 병렬로 디코딩된다. 스레드 사이에 지연이 있고; 예를 들어, 제2 스트림은 제1 스레드에 의해 디코딩된 일부 정보를 필요로 한다. 그래서, 엔트로피 디코딩을 위해 하나의 코딩 트리 블록의 지연을 이용하여 실행된다. 동일한 방식으로, 스레드 3은 스레드 2로부터의 일부 디코딩된 정보를 필요로 하는 등이다. 각각의 코딩 트리 블록의 파싱 및 재구성이 정확히 동일하다는 것을 고려하면, 도 4에 나타난 것처럼 2 코딩 트리 블록의 디코더에서 지연이 있을 것이다. 사실상 재구성을 위해, 상부 우측 코딩 트리 블록의 상부 우측 코딩 유닛은 현재의 코딩 트리 블록을 디코딩할 필요가 있을 수 있다. 그래서, 스레드가 이전의 스레드를 대기하지 못하게 하기 위해서, 2 코딩 트리 블록 지연이 고려되어야 한다.
HEVC 표준에서, 파면 처리는 명확하게 규정되지는 않는다. 일부 CABAC 재설정만이 명확하게 기술된다. 플래그 entropy_coding_sync_enabled_flag가 인에이블될 때, 그리고 코딩 트리 블록 라인의 제1 코딩 트리 블록의 제1 픽셀이 디코딩될 때, CABAC의 컨텍스트 변수는 도 5에 도시된 것처럼 공간 인접 블록 T로 초기화된다. 더 정확하게는 CABAC의 컨텍스트 변수는 블록 T의 것들과 동일한 값들을 갖는다. 이러한 블록은 상부 우측 코딩 트리 블록의 제1 블록이다. 이러한 블록 T가 이용 가능하지 않으면, 컨텍스트 변수들은 프레임의 제1 코딩 트리 블록으로서 초기화된다.
그래서, HEVC 파면에 있어서 각각의 코딩 트리 블록의 제1 블록에 대한 CABAC 종속성들만이 전통적인 디코딩 프로세스와 다르다. 전통적인 디코딩 프로세스에 있어서, 코딩 트리 블록 라인의 제1 코딩 트리 블록의 컨텍스트 변수들의 값들은 이전의 코딩 트리 블록 라인의 마지막 코딩 트리 블록의 마지막 블록의 컨텍스트 변수들의 값들과 동일하게 설정된다. 파면이 인에이블될 때, 이러한 변수 컨텍스트는 상부 우측 코딩 트리 블록(T)의 것들로 초기화된다. 이것은 양쪽 인코더 및 디코더에서 파면을 이용하기 위해 디코더 측에 필요한 유일한 변화이다.
더욱이, 일부 진입점 구문 요소들에 따른 프레임의 제1 코딩 트리 블록으로서 컨텍스트 변수 CABAC를 재설정하는 것이 가능하다. 아직, 이들 특정한 진입점들은 현재의 해결책에는 필요하지 않다.
정의되어 있는 HEVC의 스크린 내용 코딩 확장은 효율적으로 스크린 코딩 시퀀스들을 코딩하기 위해 추가의 도구들을 포함한다. 현재의 추가된 도구들은 인트라 블록 복사 모드, 팔레트 모드(Palette mode) 및 잔차 컬러 변형이다. 현재의 발명은 인트라 블록 복사 모드에만 전용되고, 그래서 이러한 모드만이 다음에서 기술된다.
그러나, 팔레트 모드와 인트라 블록 복사 모드는 새로운 인트라 모드이고 결과적으로 각각 도 1 및 2의 모듈(103 및 205)들에 추가된다.
인트라 블록 복사(IBC)는 HEVC의 스크린 내용 코딩 확장을 위한 추가의 모드로서 추가되었다. 이러한 예측 방법은 매우 반복적인 패턴들에 특히 적합하다. 특히, 이것은 글리프(glyphs)와 같은 코딩 그래픽 요소들(즉, 문자의 그래픽 표현) 또는 전통적인 GUI 요소들을 코딩하는 데 도움이 되는 것으로 알려져 있는데, 이들은 전통적인 인트라 예측 방법을 사용하여 코딩하기가 매우 어렵다.
도 6은 이러한 인트라 블록 복사 예측 모드의 작동 방식을 도시한다.
하이 레벨에서, 이미지는 래스터 스캔 순서로 인코딩되는 코딩 유닛들로 분할된다. 그러므로, 블록(601)을 코딩할 때, 영역(603)의 모든 블록이 이미 인코딩/디코딩되고, 인코더/디코더에 이용 가능하다고 간주될 수 있다. 영역(603)은 코딩 유닛(601)의 인과성 영역으로 불린다. 코딩 유닛(601)이 인코딩/디코딩될 때, 이것은 다음의 코딩 유닛을 위한 인과성 영역에 속할 것이다. 이러한 다음의 코딩 유닛뿐만 아니라, 다음의 모든 코드 유닛들은 점으로 표시된 영역(604)에 속하며, 현재의 코딩 유닛(601)을 코딩하는데 사용될 수 없다. 인과성 영역이 원시의 재구성된 블록들에 의해 구성된다는 점에 유의해야 한다. 주어진 코딩 유닛을 인코딩하는데 사용된 정보는, 이러한 정보가 디코딩에서 이용 가능하지 않다는 이유 때문에 이미지의 원래의 블록들이 아니다. 디코딩에서 이용 가능한 정보만이 인과성 영역 내의 픽셀들의 블록들의 재구성된 버전, 즉, 이들 블록의 디코딩된 버전이다. 이러한 이유로, 인코딩에서, 인과성 영역의 이전에 인코딩된 블록들은 이들 블록의 이러한 재구성된 버전을 제공하도록 디코딩된다.
INTRA 블록 복사는 블록(601)의 예측을 생성하는데 사용되어야 하는 인과성 영역에서 블록(602)을 신호화함으로써 작동한다. 예를 들어, 블록(602)은 매칭 알고리즘을 이용하여 발견될 수 있다. HEVC 스크린 내용 확장에 있어서, 이러한 블록은 블록 벡터(605)에 의해 보여지고, 예측자에 따른 이러한 벡터의 잔차는 비트스트림으로 전송된다.
INTRA 블록 복사 예측자는 현재 프레임의 모든 재구성된 인과성 영역으로부터 유래한다. 다른 INTRA 모드에 관해서, 인과성 영역은 루프 필터링되지 않는다.
이러한 블록 벡터는, 코딩 유닛(601)의 특정 점과 예측자 블록(602)의 등가의 점 사이의 좌표에서의 차이이다. INTER 블록에 관해서 서브 픽셀 정확도를 이용하는 것이 가능할 수 있지만, 이러한 변위는 일반적으로 픽셀들의 정수 단위로 되고, 따라서 비용이 많이 드는 서브 픽셀 보간을 필요로 하지 않는다.
현재의 INTRA 블록 복사 설계에서, 각각의 INTRA 블록 복사 코딩 유닛은 도 3에 도시된 것처럼 하나 또는 2개의 PU들로 나뉘어질 수 있다. 가장 작은 코딩 유닛 사이즈, 8×8를 위해, 코딩 유닛은 또한 각각의 4×4 픽셀들의 4개의 PU들로 나뉘어질 수 있다.
인터 모드를 위해, N×N 파티션은 이용 가능하지 않다. 그것은 4×4 블록 사이즈가 인터 모드에 사용될 수 없다는 것을 의미한다. 다음과 같은 표 1은 양쪽 모드를 위한 블록 사이즈를 요약한다.
블록 사이즈 | IBC 모드 | 인터 모드 |
64×64 (2N×2N) | X | X |
64×32 (2N×N) | X | X |
32×64 (N×2N) | X | X |
32×32 (2N×2N) | X | X |
32×16 (2N×N) | X | X |
16×32 (N×2N) | X | X |
16×16 (2N×2N) | X | X |
16×8 (2N×N) | X | X |
8×16 (N×2N) | X | X |
8×8 (2N×2N) | X | X |
8×4 (2N×N) | X | X |
4×8 (N×2N) | X | X |
4×4 (N×N) | X |
인트라 블록 복사 예측 모드의 현재의 구현에서, 인코더 측에서의 서치 영역은 블록 사이즈에 의존한다. 이것은 다음과 같은 표 2에 나타난다:
블록 사이즈 | 전체 범위 서치 (2CTB 영역 밖) |
2 CTB 영역 서치 |
기타 |
64×64 | 서치 없음 | ||
32×32 | 서치 없음 | ||
16×16 | 전통적인 IBC 서치 | 전통적인 IBC 서치 | |
8×8 | 해시-기반 | 전통적인 IBC 서치 | |
4×8 | 전통적인 IBC 서치 | ||
8×4 | 전통적인 IBC 서치 | ||
4×4 | 전통적인 IBC 서치 |
2N×N 및 N×2N PU 사이즈는 현재의 인코더 구현에서 단지 8×8 코딩 유닛에 대해서만 시험된다는 점에 유의해야 한다. 이들 사이즈는 이러한 표에 도시되지 않는다. 인트라 블록 복사 블록 벡터 추정의 2가지 타입이 있다. 첫번째 타입은 전통적인 INTRA 블록 복사 서치이고 그것은 전용 블록 매칭 알고리즘에 대응한다. 두번째 타입은 해시 서치 알고리즘을 기반으로 한다. 2가지 서치 범위가 또한 규정된다.
도 7에 도시된 것처럼, 프레임(701)에 대해서, 2 코딩 트리 블록 서치 범위는 좌측 코딩 트리 블록(703) 및 이미 인코딩/디코딩된 현재의 코딩 트리 블록(702)의 블록들에 대응한다. 이미 인코딩된 현재의 코딩 트리 블록의 블록들은 도 7에서 점선 영역으로 도시된다. 풀 프레임 서치는 이미 인코딩/디코딩된 모든 코딩 트리 블록(704)에 대응한다.
인트라 블록 복사 모드에서, "블록" 벡터는 인코딩하기 위한 블록(601)의 특정 점과 도 6의 예측자 블록(602)의 등가의 점 사이의 좌표에서의 차이이다. INTER 블록들에 관해서 서브픽셀 정확도를 이용하는 것이 가능할 지라도, 이러한 변위는 정수의 픽셀 단위이고, 따라서 비용이 많이 드는 서브 픽셀 보간을 필요로 하지 않는다.
이러한 블록 벡터(BV)는 예측자를 이용하여 저절로 예측되며 이는 현재의 코딩 트리 블록의 좌측 위의 BV이나 그의 최근 디코딩된 블록 벡터 또는 최근 디코딩된 BV 중 가장 최근 것일 수 있다. 물론, 이러한 벡터 예측자는 디코딩된 인트라 블록 복사 블록으로부터 유래한다. 이들 방법을 이용하여, 예측자 인덱스가 전송된다.
이전에 언급된 것처럼, INTRA 블록 복사는 인트라 모드이어서 그것의 예측자들은 임의의 루프 필터링 이전에 원시의 재구성된 데이터로부터 유래한다. 그 결과, 파면 처리를 이용하는 디코더 구현들은 디코딩에서 감소되어야 한다. 사실상 도 8에 도시된 것처럼, INTRA 블록 복사 블록 예측자는 재구성되지 않은 코딩 트리 블록으로부터 유래할 수 있다. 그래서, 그것은 디코더가 이러한 INTRA 블록 복사 예측자의 디코딩 프로세스를 완전히 대기할 수 있다는 것을 의미한다. 그래서, 각각의 코딩 트리 블록 라인의 각각의 제1 블록이 각각의 이전의 코딩 트리 블록 라인의 마지막 블록을 가리키는 최악의 경우를 고려하면, 파면을 이용한 디코딩 프로세스는 전통적인 디코딩보다 훨씬 빠를 수 없다.
본 발명의 제1 실시예에서, 현재의 코딩 트리 블록에 대해서, INTRA 블록 복사 서치 범위는 모든 좌측, 상부 좌측 및 상부 코딩 트리 블록 및 물론 현재의 코딩 트리 블록의 재구성된 블록으로 제한된다. INTRA 블록 복사 서치 범위는 예측자 블록이 INTRA 블록 복사 모드에 따른 주어진 코딩 유닛의 인코딩에 대해 서치될 수 있는 이미지에서의 영역이다. 그것은 상부 우측 코딩 트리 블록이 인코더 측에서 INTRA 블록 복사 예측에 이용할 수 없는 것으로 간주되고 따라서 현재의 코딩 트리 블록을 위한 INTRA 블록 복사 블록 예측자가 디코더 측에서 임의의 상부 우측 코딩 트리 블록을 가리킬 수 있다는 것을 의미한다. 도 9는 스레드 4의 현재의 코딩 트리 블록을 위한 이러한 실시예를 보여준다.
즉, INTRA 블록 복사 모드를 위한 서치 범위는 좌표(X, Y)의 코딩 트리 블록에 의해 구성된 영역으로서 다음과 같이 결정된다:
Y≤Y0 및 X≤X0
여기서, X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 이미지의 상부 좌측 모서리에 있고, 여기서 (X0, Y0)은 현재 코딩 트리 블록의 좌표들이다. 당연히, 현재 코딩 트리 블록에 대해서, 상기 영역은 이미 재구성된 블록들만을 포함한다.
이러한 솔루션은 구현의 관점에서 매우 단순하며 파면 프로세스를 상당히 간소화한다.
다른 실시예들에서, 인코딩 효율을 개선하기 위해서, 더 재구성된 블록들이 INTRA 블록 복사 예측 또는 현재의 코딩 트리 블록에 이용 가능하다.
하나의 실시예에서, 현재의 코딩 트리 블록의 상부 우측에서 시작하고 이미지의 상부 에지로 끝나고 대각의 좌측에 위치한 모든 코딩 트리 블록(CTB)들은 INTRA 블록 복사 예측에 이용 가능하다. 언급된 대각은, 라인이 이미지의 상부 에지에 도달할 때까지 y-축 등을 따르는 음의 방향으로 하나의 CTB가 이어진 x-축을 따르는 양의 방향으로 하나의 CTB를 진행하는 라인을 따르는 계단형(즉, 래더 성형된) 경로를 따른다. 또한, 현재의 CTB 행(스레드)의 임의의 이미 재구성된 CTB들과 현재의 CTB의 임의의 재구성된 블록들은 또한 INTRA 블록 복사 예측에 이용 가능하다. 도 10은 4번째 스레드의 현재의 코딩 트리 블록에 대한 이러한 실시예를 보여준다. 디코더 측에서 현재의 코딩 트리 블록을 위한 INTRA 블록 복사 예측자들은 이러한 영역으로부터만 유래한다. 그것은 스레드들 사이에 하나의 코딩 트리 블록 지연을 이용하는 인코더에 대응한다.
즉, 이러한 실시예에서, 좌표(X, Y)의 코딩 트리 블록들에 의해 구성된 영역으로서의 INTRA 블록 복사 모드에 대한 서치 범위는 다음과 같다:
Y≤Y0 및 (X-X0) ≤- (Y-Y0)
또 다른 실시예에서, 2 코딩 트리 블록의 지연을 가진 대각의 좌측의 모든 코딩 트리 블록은, 현재의 코딩 트리 블록의 재구성된 블록들뿐만 아니라 INTRA 블록 복사 예측에 이용 가능하다. 도 11은 4번째 스레드의 현재의 코딩 트리 블록에 대한 이러한 실시예를 보여준다.
즉, 이러한 실시예에서, 좌표(X, Y)의 코딩 트리 블록들에 의해 구성된 영역으로서의 INTRA 블록 복사 모드에 대한 서치 범위는 다음과 같다:
Y≤Y0 및 (X-X0) ≤-2 * (Y-Y0)
이러한 실시예는 첫번째 것과 비교하여 코딩 효율을 증가시키지만, 도 11에 도시된 바와 같이, 잠재적으로 이러한 서치 범위는 스레드 사이의 지연을 증가시킨다.
또 다른 실시예에서, 이전의 코딩 트리 블록 라인에 대한 1 코딩 트리 블록과 모든 다른 이전의 코딩 트리 블록 라인에 대한 2 코딩 트리 블록의 지연을 가진 대각의 좌측의 모든 코딩 트리 블록은, 현재의 코딩 트리 블록의 재구성된 블록들뿐만 아니라 INTRA 블록 복사 예측에 이용 가능하다. 도 12는 4번째 스레드의 현재의 코딩 트리 블록에 대한 이러한 실시예를 보여준다. 그것은 현재의 코딩 트리 블록을 디코딩하기 위해 이용 가능한 재구성된 상부 우측 코딩 유닛을 갖기 위해서 스레드들 사이의 2 코딩 트리 블록 지연들을 이용하여 프레임을 디코딩하는 디코더에 대응한다. 이러한 영역은 디코더 파면 처리에 더 전용적이다.
즉, 이러한 실시예에서, 좌표(X, Y)의 코딩 트리 블록들에 의해 구성된 영역으로서의 INTRA 블록 복사 모드에 대한 서치 범위는 다음과 같다:
Y≤Y0 및 (X-X0) <- 2 * (Y-Y0)
하나의 실시예에서, 스레드의 각각의 INTRA 블록 복사 블록은 이러한 동일한 스레드에 의해 재구성된 블록들만을 액세스할 수 있다. 그것은 인코더 측에서 INTRA 블록 복사를 위한 코딩 트리 블록 라인 서치 영역의 이용에 대응한다. 이러한 실시예는 파면 처리를 위한 유연한 디코딩을 제공한다. 사실상, INTRA 블록 복사 없는 구현과 비교하여 코딩 트리 블록 라인들 사이의 임의의 추가적 종속성이 없지만 그것은 인코딩 효율을 감소시킨다.
즉, 이러한 실시예에서, 좌표(X, Y)의 코딩 트리 블록들에 의해 구성된 영역으로서의 INTRA 블록 복사 모드에 대한 서치 범위는 다음과 같다:
X≤X0 및 Y = Y0
특별한 실시예에 있어서, 파면이 인에이블되면, 인코더 및 디코더의 양쪽은 요구된 수의 스레드들과의 파면 병렬성을 이용한다. 더욱이 이러한 실시예에 있어서, 스레드들은 동기화된다. 그것은 다음과 같은 코딩 트리 블록의 디코딩을 시작하기 전에, 각각의 스레드가 다른 스레드들의 모든 코딩 트리 블록의 디코딩 종료를 대기한다는 것을 의미한다. 그러한 경우에, 인코더 및 디코더에서, 모든 블록의 재구성은 코딩 트리 블록 레벨에서 동기화된다. 이러한 실시예에서, 스레드의 INTRA 블록 복사 블록은, 코딩 트리 블록이 하부 코딩 트리 블록 라인들에 있을지라도, 이용 가능한 모든 재구성된 코딩 트리 블록을 액세스할 수 있다. 예를 들어, 도 12에서, 각각의 디코딩된 코딩 트리 블록(X로 표시된)의 각각의 INTRA 블록 복사 블록은 전통적인 구현에서 스레드 4의 모든 이용 가능한 데이터를 액세스할 수 있다. 또한, 코딩 트리 블록의 각각의 블록은 그것의 자체 코딩 트리 블록의 모든 재구성된 블록을 액세스할 수 있다. 이러한 실시예의 장점은, 그것이 각각의 코딩 트리 블록을 위한 평균 블록의 수를 증가시키고 그것이 비트레이트가 일반적으로 다른 다음과 같은 코딩 트리 블록 라인들과 비교하여 가능한 예측의 부족 때문에 더 높은 제1 코딩 트리 블록 라인을 위한 서치 영역을 증가시키는 것이다. 이러한 실시예에서, 모노-스레드 디코더는 멀티스레드 디코더와 동일한 디코딩 결과를 취득할 수 있다는 점에 유의해야 한다. 사실상, 코딩 트리 블록 동기화만이 필수적이다.
도 13은 모노-스레드 디코더 구현이 2 CTB 지연에 사용될 때 CTB의 디코딩 순서를 보여준다. 고려된 지연이 1 CTB인 경우에 또 다른 순서가 필요하다.
도 14는 본 발명의 하나 이상의 실시예들의 구현을 위한 컴퓨팅 장치(1400)의 개략적인 블록도이다. 컴퓨팅 장치(1400)는 마이크로-컴퓨터, 워크스테이션 또는 경량 휴대용 장치와 같은 장치일 수 있다. 컴퓨팅 장치(1400)는 다음과 같은 것에 접속된 통신 버스를 포함한다:
- CPU로 표시된, 마이크로프로세서와 같은 중앙 처리 장치(1401);
- 본 발명의 실시예에 따른 이미지의 적어도 일부를 인코딩 또는 디코딩하기 위한 방법을 구현하기 위해 필요한 변수 및 파라미터를 기록하도록 적응된 레지스터뿐만 아니라 본 발명의 실시예의 방법의 실행가능 코드를 저장하기 위한, RAM으로 표시된, 랜덤 액세스 메모리(1402) - 그의 메모리 용량은, 예를 들어 확장 포트에 접속된 선택적 RAM에 의해 확장될 수 있음 -;
- 본 발명의 실시예를 구현하기 위한 컴퓨터 프로그램을 저장하기 위한, ROM으로 표시된, 판독 전용 메모리(1403);
- 네트워크 인터페이스(1404)는 전형적으로, 처리될 디지털 데이터가 전송되거나 수신되는 통신 네트워크에 접속된다. 네트워크 인터페이스(1404)는 단일 네트워크 인터페이스일 수 있거나, 또는 한 세트의 상이한 네트워크 인터페이스들(예를 들어, 유선 및 무선 인터페이스들, 또는 상이한 종류의 유선 또는 무선 인터페이스들)로 구성될 수 있다. 데이터 패킷들은 CPU(1401)에서 운영되는 소프트웨어 애플리케이션의 제어 하에 전송을 위한 네트워크 인터페이스에 기입되거나, 수신을 위한 네트워크 인터페이스로부터 판독된다;
- 사용자 인터페이스(1405)는 사용자로부터 입력들을 수신하거나 또는 사용자에게 정보를 표시하기 위해 이용될 수 있다;
- HD로 표시된 하드 디스크(1406)는 대용량 저장 장치로서 제공될 수 있다;
- I/O 모듈(1407)은 데이터를 비디오 소스 또는 디스플레이와 같은 외부 장치들로부터/로 수신하고/전송하기 위해 이용될 수 있다.
실행가능 코드는 판독 전용 메모리(1403), 하드 디스크(1406), 또는 예를 들어 디스크와 같은 리무버블 디지털 매체에 저장될 수 있다. 변형에 따르면, 프로그램들의 실행가능 코드는, 실행되기 전에, 하드 디스크(1406)와 같은, 통신 장치(1400)의 저장 수단들 중 하나에 저장되도록, 네트워크 인터페이스(1404)를 통해, 통신 네트워크에 의해 수신될 수 있다.
중앙 처리 장치(1401)는 본 발명의 실시예들에 따른 프로그램 또는 프로그램들의 소프트웨어 코드의 명령어들 또는 부분들의 실행을 제어 및 지시하도록 적응되며, 이들 명령어들은 앞서 언급한 저장 수단들 중 하나에 저장되어 있다. 전원이 켜진 후, CPU(1401)는 명령어들이 예를 들어 프로그램 ROM(1403) 또는 하드-디스크(HD)(1406)로부터 로딩된 후 소프트웨어 애플리케이션에 관한 메인 RAM 메모리(1402)로부터의 명령어들을 실행할 수 있다. 그러한 소프트웨어 애플리케이션은, CPU(1401)에 의해 실행될 때, 본 명세서에서 기술된 흐름도의 단계들이 수행되게 한다.
본 명세서에 기술된 알고리즘의 임의의 단계는 PC("Personal Computer"), DSP("Digital Signal Processor") 또는 마이크로컨트롤러와 같은, 프로그램가능 컴퓨팅 머신에 의한 명령어들의 집합 또는 프로그램의 실행에 의해 소프트웨어로 구현될 수 있고, 또는, FPGA("Field-Programmable Gate Array") 또는 ASIC("Application-Specific Integrated Circuit")와 같은 머신 또는 전용 컴포넌트에 의해 하드웨어로 구현될 수 있다.
본 발명이 특정 실시예를 참조하여 위와 같이 설명되었다 할지라도, 본 발명은 이 특정 실시예들에 제한되지 않으며, 통상의 기술자에게는 본 발명의 범위 내에 있는 수정들이 자명할 것이다.
전술한 예시적 실시예들을 참조하면 관련 기술 분야의 통상의 기술자에 대해 많은 추가 수정 및 변형이 제안될 것인데, 이들 실시예들은 단지 예로서 주어지고, 본 발명의 범위를 제한하도록 의도되지는 않으며, 본 발명의 범위는 첨부 청구항들에 의해서만 결정된다. 특히, 상이한 실시예들로부터의 상이한 특징들은 적절한 경우에 상호 교환될 수 있다.
청구항들에서, 용어 "포함하는(comprising)"은 다른 요소들 또는 단계들을 배제하지 아니하며, 부정 관사 "a" 또는 "an"은 복수를 배제하지 않는다. 상이한 특징들이 서로 상이한 종속항들에 인용되어 있다는 사실만으로는 이들 특징의 조합이 유리하게 이용될 수 없다는 것을 나타내지는 않는다.
Claims (16)
- 이미지를 인코딩하는 방법이며,
상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록(Coding Tree blocks)을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 상기 복수의 모드 중 하나의 모드는 상기 블록이 상기 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 모드이며,
상기 방법은,
코딩 트리 블록들을 처리하는 단계; 및
제한된 영역으로부터, 코딩 트리 블록들의 현재 열 내의 현재 코딩 트리 블록 내의 블록을 인코딩하기 위한 예측 블록을 획득하는 단계를 포함하고,
상기 제한된 영역은,
(i) 상기 현재 코딩 트리 블록 내의 이전에 처리된 블록들을 포함하고,
(ii) 처리된 코딩 트리 블록들의 서브셋(sub-set) 내의 모든 처리된 블록들을 포함하고,
처리된 코딩 트리 블록들의 상기 서브셋은 현재 및 이전에 처리된 열들 내의 모든 처리된 코딩 트리 블록들의 서브셋이고,
처리된 코딩 트리 블록들의 상기 서브셋 내의 코딩 트리 블록들의 좌표들(X, Y)은 다음과 같이 주어지고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0),
X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 상기 이미지의 상부 좌측 모서리에 있고, (X0, Y0)는 상기 현재의 코딩 트리 블록의 좌표들인, 방법. - 제1항에 있어서,
상기 코딩 트리 블록들은 파면(Wavefront) 병렬 처리를 이용하여 처리되는, 방법. - 이미지를 디코딩하는 방법이며,
상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 디코딩되고, 상기 복수의 모드 중 하나의 모드는 상기 블록이 상기 이미지의 실제 블록인 예측자 블록을 기반으로 디코딩되는 모드이며,
상기 방법은,
코딩 트리 블록들을 처리하는 단계; 및
제한된 영역으로부터, 코딩 트리 블록들의 현재 열 내의 현재 코딩 트리 블록 내의 블록을 디코딩하기 위한 예측 블록을 획득하는 단계를 포함하고,
상기 제한된 영역은,
(i) 상기 현재 코딩 트리 블록 내의 이전에 처리된 블록들을 포함하고,
(ii) 처리된 코딩 트리 블록들의 서브셋 내의 모든 처리된 블록들을 포함하고,
처리된 코딩 트리 블록들의 상기 서브셋은 현재 및 이전에 처리된 열들 내의 모든 처리된 코딩 트리 블록들의 서브셋이고,
처리된 코딩 트리 블록들의 상기 서브셋 내의 코딩 트리 블록들의 좌표들(X, Y)은 다음과 같이 주어지고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0),
X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 상기 이미지의 상부 좌측 모서리에 있고, (X0, Y0)는 상기 현재의 코딩 트리 블록의 좌표들인, 방법. - 제3항에 있어서,
상기 코딩 트리 블록들은 파면 병렬 처리를 이용하여 처리되는, 방법. - 이미지를 인코딩하는 디바이스이며,
상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 인코딩되고, 상기 복수의 모드 중 하나의 모드는 상기 블록이 상기 이미지의 실제 블록인 예측자 블록을 기반으로 인코딩되는 모드이며,
상기 디바이스는,
코딩 트리 블록들을 처리하는 처리 수단; 및
제한된 영역으로부터, 코딩 트리 블록들의 현재 열 내의 현재 코딩 트리 블록 내의 블록을 인코딩하기 위한 예측 블록을 획득하는 수단를 포함하고,
상기 제한된 영역은,
(i) 상기 현재 코딩 트리 블록 내의 이전에 처리된 블록들을 포함하고,
(ii) 처리된 코딩 트리 블록들의 서브셋 내의 모든 처리된 블록들을 포함하고,
처리된 코딩 트리 블록들의 상기 서브셋은 현재 및 이전에 처리된 열들 내의 모든 처리된 코딩 트리 블록들의 서브셋이고,
처리된 코딩 트리 블록들의 상기 서브셋 내의 코딩 트리 블록들의 좌표들(X, Y)은 다음과 같이 주어지고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0),
X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 상기 이미지의 상부 좌측 모서리에 있고, (X0, Y0)는 상기 현재의 코딩 트리 블록의 좌표들인. 디바이스. - 이미지를 디코딩하는 디바이스이며,
상기 이미지는 픽셀들의 블록들로 이루어진 복수의 코딩 트리 블록을 포함하고, 픽셀들의 각각의 블록은 복수의 모드 중 하나의 모드에 따라 디코딩되고, 상기 복수의 모드 중 하나의 모드는 상기 블록이 상기 이미지의 실제 블록인 예측자 블록을 기반으로 디코딩되는 모드이며,
상기 디바이스는,
코딩 트리 블록들을 처리하는 처리 수단; 및
제한된 영역으로부터, 코딩 트리 블록들의 현재 열 내의 현재 코딩 트리 블록 내의 블록을 디코딩하기 위한 예측 블록을 획득하는 수단를 포함하고,
상기 제한된 영역은,
(i) 상기 현재 코딩 트리 블록 내의 이전에 처리된 블록들을 포함하고,
(ii) 처리된 코딩 트리 블록들의 서브셋 내의 모든 처리된 블록들을 포함하고,
처리된 코딩 트리 블록들의 상기 서브셋은 현재 및 이전에 처리된 열들 내의 모든 처리된 코딩 트리 블록들의 서브셋이고,
처리된 코딩 트리 블록들의 상기 서브셋 내의 코딩 트리 블록들의 좌표들(X, Y)은 다음과 같이 주어지고,
Y≤Y0 및 (X-X0) ≤- (Y-Y0),
X는 수평 좌표를 나타내고, Y는 수직 좌표를 나타내며, 원점은 상기 이미지의 상부 좌측 모서리에 있고, (X0, Y0)는 상기 현재의 코딩 트리 블록의 좌표들인. 디바이스. - 이미지를 인코딩 및 디코딩하는 시스템이며,
상기 시스템은 제5항에 따른 이미지를 인코딩하는 디바이스 및 제6항에 따른 이미지를 디코딩하는 디바이스를 포함하는, 시스템. - 제7항에 있어서,
상기 인코딩하는 디바이스 및 상기 디코딩하는 디바이스 중 적어도 하나는 파면 병렬 처리를 이용하여 상기 코딩 트리 블록들을 처리하도록 구성되는, 시스템. - 제8항에 있어서,
상기 인코딩하는 디바이스 및 상기 디코딩하는 디바이스는 상기 이미지를 각각 인코딩 및 디코딩하기 위한 동일한 수의 동기화된 스레드(thread)들을 이용하도록 구성되는, 시스템. - 컴퓨터-판독가능 저장 매체이며,
실행시 프로그래밍 가능 장치가 제1항 내지 제4항 중 어느 한 항에 따른 방법을 구현하게 하는, 프로그래밍 가능 장치를 위한 컴퓨터 프로그램을 저장하는, 컴퓨터-판독가능 저장 매체. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1417634.1A GB2531001B (en) | 2014-10-06 | 2014-10-06 | Method and apparatus for vector encoding in video coding and decoding |
GB1417634.1 | 2014-10-06 | ||
PCT/EP2015/073060 WO2016055484A1 (en) | 2014-10-06 | 2015-10-06 | Method and apparatus for vector encoding in video coding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170063808A KR20170063808A (ko) | 2017-06-08 |
KR102076398B1 true KR102076398B1 (ko) | 2020-02-11 |
Family
ID=51946909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011152A KR102076398B1 (ko) | 2014-10-06 | 2015-10-06 | 비디오 코딩 및 디코딩에서의 벡터 인코딩을 위한 방법 및 장치 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11051037B2 (ko) |
EP (1) | EP3205091B1 (ko) |
JP (1) | JP6590918B2 (ko) |
KR (1) | KR102076398B1 (ko) |
CN (1) | CN106797464B (ko) |
GB (1) | GB2531001B (ko) |
RU (2) | RU2684200C2 (ko) |
WO (1) | WO2016055484A1 (ko) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016165623A1 (en) * | 2015-04-13 | 2016-10-20 | Mediatek Inc. | Methods of constrained intra block copy for reducing worst case bandwidth in video coding |
WO2018076336A1 (zh) * | 2016-10-31 | 2018-05-03 | 富士通株式会社 | 视频解码方法、视频解码装置和电子设备 |
FR3068557A1 (fr) * | 2017-07-05 | 2019-01-04 | Orange | Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants |
FR3068558A1 (fr) | 2017-07-05 | 2019-01-04 | Orange | Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants |
FR3062010A1 (fr) | 2017-07-05 | 2018-07-20 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images |
WO2019230904A1 (ja) * | 2018-06-01 | 2019-12-05 | シャープ株式会社 | 画像復号装置、および画像符号化装置 |
MX2021000525A (es) * | 2018-07-18 | 2021-04-12 | Beijing Dajia Internet Information Tech Co Ltd | Metodos y aparato de codificacion de video que usa el campo tecnico de prediccion de vectores de movimiento basado en el historial. |
US11159788B2 (en) * | 2018-08-03 | 2021-10-26 | Mediatek Inc. | Method and apparatus of enhanced Intra Block Copying mode for video coding |
CN113170106A (zh) * | 2018-11-28 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 帧内块复制模式中运动参考的扩展方法 |
WO2020125798A1 (en) | 2018-12-22 | 2020-06-25 | Beijing Bytedance Network Technology Co., Ltd. | Intra block copy mode with dual tree partition |
US11800123B2 (en) | 2018-12-21 | 2023-10-24 | Sony Group Corporation | Image processing apparatus and method |
WO2020140954A1 (en) * | 2019-01-02 | 2020-07-09 | Beijing Bytedance Network Technology Co., Ltd | Simplification of hash-based motion searching |
WO2020156548A1 (en) | 2019-02-02 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Buffer updating for intra block copy in video coding |
SG11202107959WA (en) * | 2019-02-02 | 2021-08-30 | Beijing Bytedance Network Technology Co Ltd | Buffer management for intra block copy in video coding |
CN113508597B (zh) | 2019-03-01 | 2023-11-21 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的基于方向的预测 |
CN113519158B (zh) | 2019-03-01 | 2024-06-18 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的块矢量表示 |
KR20240132530A (ko) | 2019-03-04 | 2024-09-03 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 인트라 블록 복사의 구현 형태 |
US11252442B2 (en) * | 2019-04-08 | 2022-02-15 | Tencent America LLC | Method and apparatus for video coding |
AU2020309663C1 (en) | 2019-07-06 | 2023-12-14 | Beijing Bytedance Network Technology Co., Ltd. | Virtual prediction buffer for intra block copy in video coding |
BR112022000358A2 (pt) * | 2019-07-10 | 2022-05-10 | Beijing Bytedance Network Tech Co Ltd | Método e aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador |
KR102695788B1 (ko) | 2019-07-11 | 2024-08-14 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩에서 인트라 블록 복사를 위한 비트스트림 적합 제약 |
MX2022000714A (es) * | 2019-07-25 | 2022-02-23 | Beijing Bytedance Network Tech Co Ltd | Restriccion de mapeo para bufer virtual de copia intrabloque. |
CN114503580B (zh) | 2019-09-23 | 2024-08-02 | 北京字节跳动网络技术有限公司 | 基于虚拟管线数据单元设置帧内块复制虚拟缓冲区 |
WO2021185306A1 (en) | 2020-03-18 | 2021-09-23 | Beijing Bytedance Network Technology Co., Ltd. | Intra block copy buffer and palette predictor update |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130020251A1 (en) | 2010-03-23 | 2013-01-24 | Toray Industries, Inc. | Separation membrane and method for producing same |
US20130121417A1 (en) | 2011-11-16 | 2013-05-16 | Qualcomm Incorporated | Constrained reference picture sets in wave front parallel processing of video data |
US20130272370A1 (en) * | 2012-04-11 | 2013-10-17 | Qualcomm Incorporated | Wavefront parallel processing for video coding |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100954609B1 (ko) | 2002-04-23 | 2010-04-26 | 노키아 코포레이션 | 비디오 부호화 시스템에서 양자화 변수들을 표시하는 방법및 장치 |
CN101064849A (zh) | 2006-04-29 | 2007-10-31 | 鲁海宁 | 动态图像编码方法、装置和计算机可读记录介质 |
US8837592B2 (en) * | 2010-04-14 | 2014-09-16 | Mediatek Inc. | Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus |
US8837577B2 (en) | 2010-07-15 | 2014-09-16 | Sharp Laboratories Of America, Inc. | Method of parallel video coding based upon prediction type |
US20120082238A1 (en) * | 2010-10-01 | 2012-04-05 | General Instrument Corporation | Coding and decoding utilizing picture boundary variability in flexible partitioning |
US9749661B2 (en) * | 2012-01-18 | 2017-08-29 | Qualcomm Incorporated | Sub-streams for wavefront parallel processing in video coding |
US10390034B2 (en) * | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US10477232B2 (en) * | 2014-03-21 | 2019-11-12 | Qualcomm Incorporated | Search region determination for intra block copy in video coding |
CA2951009A1 (en) | 2014-06-20 | 2015-12-23 | Sony Corporation | Image encoding device and method, and image decoding device and method |
CN106464896B (zh) * | 2014-07-07 | 2020-03-13 | 寰发股份有限公司 | 利用帧内区块复制模式编码的视频编码方法 |
JP2017535145A (ja) * | 2014-09-30 | 2017-11-24 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 波面並列処理が可能にされた場合のピクチャ内予測モードに関する規則 |
CN107409220B (zh) * | 2015-01-29 | 2020-07-24 | Vid拓展公司 | 块内拷贝搜索 |
-
2014
- 2014-10-06 GB GB1417634.1A patent/GB2531001B/en active Active
-
2015
- 2015-10-06 JP JP2017517079A patent/JP6590918B2/ja active Active
- 2015-10-06 KR KR1020177011152A patent/KR102076398B1/ko active IP Right Grant
- 2015-10-06 RU RU2018126868A patent/RU2684200C2/ru active
- 2015-10-06 EP EP15781605.9A patent/EP3205091B1/en active Active
- 2015-10-06 CN CN201580053419.6A patent/CN106797464B/zh active Active
- 2015-10-06 US US15/516,856 patent/US11051037B2/en active Active
- 2015-10-06 WO PCT/EP2015/073060 patent/WO2016055484A1/en active Application Filing
- 2015-10-06 RU RU2017115409A patent/RU2663348C1/ru active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130020251A1 (en) | 2010-03-23 | 2013-01-24 | Toray Industries, Inc. | Separation membrane and method for producing same |
US20130121417A1 (en) | 2011-11-16 | 2013-05-16 | Qualcomm Incorporated | Constrained reference picture sets in wave front parallel processing of video data |
US20130272370A1 (en) * | 2012-04-11 | 2013-10-17 | Qualcomm Incorporated | Wavefront parallel processing for video coding |
Non-Patent Citations (2)
Title |
---|
C. Gordon, F. Henry, S. Pateux, "Wavefront Parallel Processing for. HEVC Encoding and Decoding", JCTVC-F274, July, 2011. |
KWON DO-Kyoung ET AL "Fast intra block copy search for HEVC screen content coding", 2104 IEEE |
Also Published As
Publication number | Publication date |
---|---|
US11051037B2 (en) | 2021-06-29 |
EP3205091A1 (en) | 2017-08-16 |
JP2017535150A (ja) | 2017-11-24 |
JP6590918B2 (ja) | 2019-10-16 |
RU2018126868A (ru) | 2019-03-13 |
US20180302645A1 (en) | 2018-10-18 |
CN106797464A (zh) | 2017-05-31 |
RU2663348C1 (ru) | 2018-08-03 |
GB201417634D0 (en) | 2014-11-19 |
RU2018126868A3 (ko) | 2019-03-13 |
WO2016055484A1 (en) | 2016-04-14 |
KR20170063808A (ko) | 2017-06-08 |
GB2531001A (en) | 2016-04-13 |
RU2684200C2 (ru) | 2019-04-04 |
GB2531001B (en) | 2019-06-05 |
EP3205091B1 (en) | 2023-05-17 |
CN106797464B (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102076398B1 (ko) | 비디오 코딩 및 디코딩에서의 벡터 인코딩을 위한 방법 및 장치 | |
US11044473B2 (en) | Adaptive loop filtering classification in video coding | |
US10721469B2 (en) | Line buffer reduction for adaptive loop filtering in video coding | |
JP6931690B2 (ja) | コンテンツをエンコードする方法及び計算装置 | |
US11611757B2 (en) | Position dependent intra prediction combination extended with angular modes | |
US20190238845A1 (en) | Adaptive loop filtering on deblocking filter results in video coding | |
CN108965871B (zh) | 图像预测的方法及装置 | |
US10009615B2 (en) | Method and apparatus for vector encoding in video coding and decoding | |
EP3202150B1 (en) | Rules for intra-picture prediction modes when wavefront parallel processing is enabled | |
US10567754B2 (en) | Hash table construction and availability checking for hash-based block matching | |
US9838692B2 (en) | Detecting availabilities of neighboring video units for video coding | |
US20190014315A1 (en) | Adaptive loop filter with enhanced classification methods | |
US20150350674A1 (en) | Method and apparatus for block encoding in video coding and decoding | |
US10178405B2 (en) | Enhanced coding and decoding using intra block copy mode | |
GB2533905A (en) | Method and apparatus for video coding and decoding | |
JP2023509838A (ja) | サブピクチャ分割情報をシグナリングするための方法及び機器 | |
US9219926B2 (en) | Image encoding apparatus, image encoding method and program, image decoding apparatus, image decoding method and program | |
US10805611B2 (en) | Method and apparatus of constrained sequence header |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |