CN111107367B - 块分割方法和装置 - Google Patents
块分割方法和装置 Download PDFInfo
- Publication number
- CN111107367B CN111107367B CN201911033557.4A CN201911033557A CN111107367B CN 111107367 B CN111107367 B CN 111107367B CN 201911033557 A CN201911033557 A CN 201911033557A CN 111107367 B CN111107367 B CN 111107367B
- Authority
- CN
- China
- Prior art keywords
- block
- eqt
- sub
- current video
- video block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 390
- 230000011218 segmentation Effects 0.000 title claims abstract description 174
- 230000008569 process Effects 0.000 claims abstract description 205
- 238000005192 partition Methods 0.000 claims abstract description 107
- 238000012545 processing Methods 0.000 claims abstract description 87
- 230000000007 visual effect Effects 0.000 claims abstract description 83
- 230000007704 transition Effects 0.000 claims abstract description 31
- 238000000638 solvent extraction Methods 0.000 claims description 52
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims 5
- 230000011664 signaling Effects 0.000 description 15
- 230000002123 temporal effect Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 241000023320 Luma <angiosperm> Species 0.000 description 8
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 101150114515 CTBS gene Proteins 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/454—Content or additional data filtering, e.g. blocking advertisements
- H04N21/4542—Blocking scenes or portions of the received content, e.g. censoring scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/40—Tree coding, e.g. quadtree, octree
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Computer Vision & Pattern Recognition (AREA)
Abstract
本公开涉及块分割方法和装置。一种视觉媒体处理的方法,包括:至少部分基于用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将规则用于分割当前块,则根据二叉树(BT)分割处理或第二EQT分割处理将每个子块进一步划分,并且进一步,其中BT处理和第二EQT分割处理二者都具有满足预定义关系的树深度。
Description
相关申请的交叉引用
本申请及时要求于2018年10月26日提交的国际专利申请号PCT/CN2018/111990的优先权和利益。将前述申请的全部公开以引用方式并入本文,作为本申请公开的一部分。
技术领域
本申请文件涉及视频编码和解码技术、设备和系统。
背景技术
目前,正在努力提高当前视频编解码器技术的性能,以提供更好的压缩比或提供允许较低复杂度或并行实现的视频编码和解码方案。业内专家最近提出了一些新的视频编解码工具,并且目前正在进行测试以确定其有效性。
发明内容
在一个方面,视觉媒体处理的方法包括:至少部分基于用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则根据二叉树(BT)分割处理或第二EQT分割处理将每个子块进一步划分,并且进一步,其中BT处理和第二EQT分割处理二者都具有满足预定义关系的树深度。
在另一方面,视觉媒体处理的方法包括:至少部分基于用于使用BT分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,BT分割处理包括:将给定块恰好分割成两个子块;并且其中,规则规定:如果将该规则用于分割当前块,则根据另一个二叉树(BT)分割处理和/或EQT分割处理将每个子块进一步划分,其中EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且进一步,其中BT处理和EQT分割处理二者都具有满足预定义关系的深度。
在又一方面,视觉媒体处理的方法包括:至少部分基于用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸相同的允许的根节点尺寸。
在另一方面,视觉媒体处理的方法包括:至少部分基于用于使用EQT分割处理或BT分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;其中,BT分割处理包括:将给定块恰好分割成两个子块;并且其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向。
在又一方面,视觉媒体处理的方法包括:至少部分基于用于使用EQT分割处理或BT分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;其中,BT分割处理包括:将给定块恰好分割成两个子块;其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向,并且其中,通过使用至少基于一个或多个临近块的深度信息或当前块的深度信息的上下文编解码,生成第一字段或第二字段。
在另一方面,视觉媒体处理的方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的宽度或高度,将EQT分割处理应用于当前块。
在又一方面,视觉媒体处理的方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的位置对当前块进行EQT分割处理。
在另一方面,视觉媒体处理的方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,如果规则不允许当前块的EQT分割处理,则从编解码表示中省略与EQT分割处理相关联的对应语法元素。
在又一方面,视觉媒体处理的方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应编解码表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,无论规则是否允许当前块的EQT分割处理,都在编解码表示中信令通知与EQT分割处理相关联的对应语法元素。
在又一典型的方面,本文所述的各种技术可以实施为存储在非暂时性计算机可读介质上的计算机程序产品。计算机程序产品包括用于执行本文所述方法的程序代码。
在又一示例方面,视频编解码装置可实现本文所述的方法。
在又一典型的方面,公开了实现本文所述的视频解码方法的视频解码装置。
在附件、附图和下面的描述中阐述了一个或多个实现的细节。其它特征将从说明书和附图以及权利要求书中显而易见。
附图说明
图1示出了视频编码和解码的示例实现的框图。
图2示出了根据H.264/音频视频编解码器(AVC)标准的宏块(MB)分割的示例。
图3示出了用于将编解码块(CB)划分成受特定尺寸约束的预测块(PB)的模式的示例。例如,只允许帧内图片使用M x M和M/2x M/2的尺寸。
图4A示出了带分割的CTB。
图4B示出与图4A的CTB相对应的四叉树。
图5A和5B示出了四叉树二叉树(QTBT)结构的示例。
图6示出了块分割的各种示例。
图7A至7K示出了块分割的示例。
图8A至8D示出了块分割的示例。
图9A至9B示出了广义三叉树分割(GTT)的示例。
图10示出了多功能边界分割的语法和语义的示例。
图11A至11B示出了可进一步划分为EQT或BT的允许EQT模式的示例。
图12示出了分割的二值化的示例。
图13A和13B示出了水平和垂直EQT的示例。
图14示出了用于实现一些公开方法的示例硬件平台。
图15示出了用于实现一些公开方法的另一示例硬件平台。
图16是视觉媒体处理的示例方法的流程图。
图17是可以实现所公开的技术的示例视频处理系统的框图。
图18是视频处理的示例方法的流程图。
具体实施方式
为了提高视频的压缩比,研究人员不断寻找新的技术来编解码视频。本文提供可由视频比特流的解码器使用的各种技术,以提高解压缩或解码的数字视频的质量。此外,视频编解码器也可以在编解码处理中实现这些技术,以便重构用于进一步编解码的解码帧。
在本文中,使用章节标题用于提高可读性,并且不将每个章节中描述的技术和实施例的范围仅限于该章节。此外,虽然使用了各种现有视频编解码器标准的某些术语,但所公开的技术不仅限于这些视频标准或其后续标准,并且适用于其他视频编解码器标准。此外,在某些情况下,使用对应的编码步骤公开了技术,并且应当理解的是,将在解码器上执行相反顺序的对应解码步骤。此外,编解码还可用于执行转码,其中视频从一种编解码表示(例如,一种比特率)表示为另一个编解码表示(例如,不同的比特率)。
1.简要概述
本文涉及图片/视频编解码,特别是在分割结构方面,即如何将一个编解码树单元(CTU)划分成多个编解码单元(CU)以及如何固定编解码器以选择最佳分割结构。其可应用于现有的视频编解码标准,如HEVC,或待定案的标准(多功能视频编解码)。也可能适用于未来的视频编码标准或视频编解码器。
2.视频编码和解码技术的介绍
视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而发展起来的。ITU-T开发了H.261和H.263,ISO/IEC开发了MPEG-1和MPEG-4视觉,并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。自H.262以来,视频编码标准基于混合视频编解码结构,其中采用了时域预测加变换编解码。典型HEVC编解码器框架的示例如图1所示。
2.1H.264/AVC中的划分树结构
先前标准中编解码层的核心是宏块,包含16×16的亮度样本块,并且在常规的4:2:0颜色采样情况下,包含两个对应的8×8的色度样本块。
内部编解码块使用空域预测来探索像素之间的空域相关性。定义了两种划分:16x16和4x4。
帧间编解码块通过估计图片之间的运动来使用时域预测,而不是空域预测。可以单独估计16x16宏块或其任何子宏块划分的运动:16x8、8x16、8x8、8x4、4x8、4x4(例如,参见图5A)。每个子宏块划分只允许一个运动矢量(MV)。
图2示出了H.264/AVC中MB分割的示例。
2.2HEVC中的划分树结构
在HEVC中,通过使用四叉树结构(表示为编解码树)将CTU划分成CU来适应各种局部特性。在CU级别决定是使用图片间(时域)预测还是图片内(空域)预测对图片区域进行编解码。根据PU的划分类型,每个CU可以进一步划分成一个、两个或四个PU。在一个PU中,应用相同的预测处理,并且相关信息以PU为基础传输到解码器。在基于PU划分类型通过应用预测处理获得残差块后,可以根据与CU的编解码树相似的另一个四叉树结构将CU划分成变换单元(TU)。HEVC结构的一个重要特征是它具有多个划分概念,包括CU、PU以及TU。
在下文中,使用HEVC的混合视频编解码中涉及的各种特征突出显示如下。
1)编解码树单元和编解码树块(CTB)结构:HEVC中的类似结构是编解码树单元(CTU),其具有由编解码器选择并且可以大于传统的宏块的尺寸。CTU由亮度CTB和对应的色度CTB以及语法元素组成。亮度CTB的尺寸L×L可以选择为L=16、32或64个样本,较大的尺寸通常能够实现更好的压缩。然后,HEVC支持使用树结构和四叉树式信令将CTB划分为更小的块。
2)编解码单元(CU)和编解码块(CB):CTU的四叉树语法规定了其亮度和色度CB的尺寸和位置。四叉树的根与CTU相关联。因此,亮度CTB的尺寸是亮度CB支持的最大尺寸。CTU的亮度和色度CB的划分是联合发信令的。一个亮度CB和通常两个色度CB以及相关的语法一起形成编解码单元(CU)。CTB可以只包含一个CU,也可以划分形成多个CU,并且每个CU都有一个相关的划分,划分成预测单元(PU)和转换单元树(TU)。
3)预测单元和预测块(PB):在CU级别决定是使用图片间预测还是图片内预测对图片区域进行编解码。PU划分结构的根位于CU级。取决于基本的预测类型决定,可以在尺寸上进一步划分亮度和色度CB,并从亮度和色度预测块(PB)中预测亮度和色度CB。HEVC支持从64×64到4×4个样本的可变PB尺寸。
4)TU和变换块:使用块变换对预测残差进行编解码。TU树结构的根位于CU级。亮度CB残差可能与亮度变换块(TB)相同,或者也可能进一步划分成更小的亮度TB。同样适用于色度TB。对于4×4、8×8、16×16和32×32的方形TB定义了与离散余弦变换(DCT)相似的整数基函数。对于亮度图片内预测残差的4×4变换,也可以规定从离散正弦变换(DST)形式推导的整数变换。
图3示出了用于将编解码块(CB)划分成受特定尺寸约束的预测块(PB)的模式的示例。例如,只允许帧内图片使用M x M和M/2x M/2的尺寸。
图4A和4B示出了将编解码树块(CTB)细分成CB和转换块(TB)的示例。在这些图中,实线指示CB边界,并且虚线指示TB边界。例如,图4A示出带分割的CTB。图4B示出与图4A的CTB相对应的四叉树。
2.3JEM中具有较大CTU的四叉树加二叉树块结构
为探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年共同成立了联合视频探索团队(JVET)。从那时起,JVET采用了许多新的方法,并将其应用到了名为联合探索模型(JEM)的参考软件中。
2.3.1QTBT块分割结构
与HEVC不同,QTBT结构消除了多个划分类型的概念。即,其消除了CU、PU和TU概念的分离,并支持CU划分形状的更多灵活性。在QTBT块结构中,CU可以是方形或矩形。
图5A和5B示出了四叉树二叉树(QTBT)结构的示例。如图5A和5B所示,首先用四叉树结构对编解码树单元(CTU)进行分割。四叉树叶节点进一步被二叉树结构分割。在二叉树分割中有两种分割类型:对称的水平分割和对称的垂直分割。二叉树叶节点被称为编解码单元(CU),该分割用于预测和转换处理,而无需进一步分割。这意味着在QTBT编解码块结构中CU、PU和TU具有相同的块尺寸。在JEM中,CU有时由不同颜色分量的编解码块(CB)组成,例如,在4:2:0色度格式的P条带和B条带中,一个CU包含一个亮度CB和两个色度CB,并且CU有时由单个分量的CB组成,例如,在I条带的情况下,一个CU仅包含一个亮度CB或仅包含两个色度CB。
为QTBT划分方案定义了以下参数。
–CTU尺寸:四叉树的根节点尺寸,与HEVC中的概念相同。
–MinQTSize:最小允许的四叉树叶节点尺寸
–MaxBTSize:最大允许的二叉树根节点尺寸
–MaxBTDepth:最大允许的二叉树深度
–MinBTSize:最小允许的二叉树叶节点尺寸
在QTBT分割结构的一个示例中,CTU尺寸被设置为具有两个对应的64×64色度样本块的128×128个亮度样本,MinQTSize被设置为16×16,MaxBTSize被设置为64×64,MinBTSize(宽度和高度)被设置为4×4,MaxBTSize被设置为4。四叉树分割首先应用于CTU,以生成四叉树叶节点。四叉树叶节点的尺寸可以具有从16×16(即MinQTSize)到128×128(即CTU尺寸)的尺寸。如果叶四叉树节点是128×128,则其不会被二叉树进一步划分,因为其尺寸超过了MaxBTSize(即64×64)。否则,叶四叉树节点可以被二叉树进一步划分。因此,四叉树叶节点也是二叉树的根节点,并且其二叉树深度为0。当二叉树深度达到MaxBTDepth(即4)时,不考虑进一步划分。当二叉树节点的宽度等于MinBTSize(即4)时,不考虑进一步的水平划分。同样,当二叉树节点的高度等于MinBTSize时,不考虑进一步的垂直划分。通过预测和变换处理进一步处理二叉树的叶节点,而不需要进一步的划分。在JEM中,最大CTU尺寸为256×256个亮度样本。
在二叉树的每个划分(即非叶)节点中,例如如图5B所示,会对一个标志发信令来指示使用哪种划分类型(即水平或垂直),其中0表示水平划分,1表示垂直划分。对于四叉树划分,不需要指明划分类型,因为四叉树划分总是水平和垂直划分一个块,以生成尺寸相同的4个子块。
此外,QTBT方案支持亮度和色度具有单独的QTBT结构的能力。目前,对于P条带和B条带,一个CTU中的亮度和色度CTB共享相同的QTBT结构。然而,对于I条带,用QTBT结构将亮度CTB划分为CU,用另一个QTBT结构将色度CTB划分为色度CU。这意味着I条带中的CU由亮度分量的编解码块或两个色度分量的编解码块组成,P条带或B条带中的CU由所有三种颜色分量的编解码块组成。
在HEVC中,为了减少运动补偿的内存访问,限制小块的帧间预测,使得4×8和8×4块不支持双向预测,并且4×4块不支持帧间预测。在JEM的QTBT中,这些限制被移除。
2.4VVC的三叉树
在一些实现中,支持四叉树和二叉树以外的树类型。在实现中,还引入了另外两个三叉树(TT)划分,即水平和垂直的中心侧三叉树,如图6(d)和图6(e)所示。
图6示出了块分割模式的示例:(a)四叉树划分(b)垂直二叉树划分(c)水平二叉树划分(d)垂直中心侧三叉树划分(e)水平中心侧三叉树划分。
在一些实现中,可由有两个层次的树:区域树(四叉树)和预测树(二叉树或三叉树)。首先用区域树(RT)对CTU进行划分。可以进一步用预测树(PT)划分RT叶。也可以用PT进一步划分PT叶,直到达到最大PT深度。PT叶是基本的编解码单元。为了方便起见,它仍然被称为CU。CU不能进一步划分。预测和变换都以与JEM相同的方式应用于CU。整个划分结构被称为“多类型树”。
2.5扩展四叉树
与块分割处理相对应的扩展四叉树(EQT)分割结构包括:视频数据块的扩展四叉树分割处理,其中扩展四叉树分割结构表示将视频数据块分割为最终子块,并且当扩展四叉树分割处理决定将扩展四叉树分割应用于一个给定块时,的一个给定块总是被划分为四个子块;基于视频比特流对最终子块进行解码;以及基于根据导出的EQT结构解码的最终子块对视频数据块进行解码。在上述专利申请中介绍了EQT,通过引用将其并入本文。
EQT分割处理可以递归地应用于给定块以生成EQT叶节点。可选地,当EQT应用于某个块时,对于由于EQT而产生的每个子块,它可以进一步划分为BT、和/或QT、和/或TT、和/或EQT、和/或其他类型的分割树。
在一个示例中,EQT和QT可以共享相同的深度增量处理和相同的叶节点尺寸限制。在这种情况下,当节点的尺寸达到最小允许的四叉树叶节点尺寸或当节点的EQT深度达到最大允许的四叉树深度时,可以隐式地终止一个节点的分割。
可选地,EQT和QT可以共享不同的深度增量处理和/或叶节点尺寸限制。当节点的尺寸达到最小允许的EQT叶节点尺寸或与该节点相关联的EQT深度达到最大允许的EQT深度时,隐式地终止EQT对一个节点的分割。此外,在一个示例中,可以在序列参数集(SPS)、和/或图片参数集(PPS)、和/或条带标头、和/或CTU、和/或区域、和/或片、和/或CU中对EQT深度和/或最小允许的EQT叶节点尺寸发信令。
对于尺寸为M x N(M和N是非零正整数值,相等或不相等)的块,替代使用应用于正方形块的当前四叉树分割,在EQT中,一个块可以等分为四个分割,例如M/4x N或M x N/4(示例在图7A和7B示出),或者等分为四个分割且分割尺寸取决于M和N的最大和最小值。在一个示例中,一个4x32块可以划分为四个4x8子块,而一个32x4块可以划分为四个8x4子块。
对于尺寸为M x N(M和N是非零正整数值,相等或不相等)的块,替代使用应用于正方形块的当前四叉树分割,在EQT中,一个块可以不等地分为四个分割,例如两个分割的尺寸等于(M*w0/w)x(N*h0/h),并且另外两个分割的尺寸等于(M*(w-w0)/w)x(N*(h-h0)/h)。
例如,w0和w可以分别等于1和2,即宽度减少一半,而高度可以使用不是2:1的其他比率来获得子块。图7C和7E描述了这种情况的示例。可选地,h0和h可以分别等于1和2,即高度减少一半,宽度可以使用不是2:1的其他比例。图7D和7F中描述了这种情况的示例。
图7G和7H示出了四叉树分割的两个可选示例。
图7I示出了具有不同分割形状的四叉树分割的更一般的情况。
图7J和7K示出了图7A和7B的一般示例。
图7C示出了宽度固定为M/2、高度等于N/4或3N/4、顶部两个分割较小的子块。(d)高度固定为N/2、宽度等于M/4或3M/4、左侧两个分割的较小的子块。
图7E示出了宽度固定为M/2、高度等于3N/4或N/4、底部两个分割的较小的子块。图7F示出了高度固定为N/2、宽度等于3M/4或M/4、右侧两个分割的较小的子块。示出了以下示例维度,图7G M x N/4和M/2x N/2;图7H:N x M/4和N/2x M/2;图7i:M1xN1、(M-M1xN1、M1x(N-N1)和(M-M1)x(N-N1);图7J:MxN1、MxN2、MxN3和M x N4,其中N1+N2+N3+N4=N;图7K:M1xN、M2xN、M3xN和M4xN,其中M1+M2+M3+M4=M。
与块分割处理相对应的灵活树(FT)划分结构包括:视频数据块的FT分割处理,其中FT分割结构表示将视频数据块分割为最终子块,并且当FT分割处理决定将FT分割应用于一个给定块时,的一个给定块被划分为K个子块,其中K可以大于4;基于视频比特流对最终子块进行解码;以及基于根据导出的FT结构解码的最终子块对视频数据块进行解码。
FT分割处理可以递归地应用于给定块以生成FT叶节点。当节点达到最小允许的FT叶节点尺寸或当与节点相关联的FT深度达到最大允许的FT深度时,可以隐式地终止一个节点的分割。
可选地,当FT应用于某个块时,对于由于FT而产生的每个子块,它可以进一步划分为BT、和/或QT、和/或EQT、和/或TT、和/或其他类型的分割树。
可选地,此外,可以在序列参数集(SPS)、和/或图片参数集(PPS)、和/或条带标头、和/或CTU、和/或区域、和/或片、和/或CU中对FT深度和/或最小允许的FT叶节点尺寸发信令。
与提出的EQT类似,由于FT分割获得的所有子块的尺寸可能相同;可选地,不同子块的尺寸可能不同。
在一个示例中,K等于6或8。图8A至8D中描绘了一些示例,其中示出了FT分割的示例(在图8C和8D中,K=6;或者在图8A和8B中,K=8)。
对于TT,可以取消沿水平或垂直方向划分的限制。
在一个示例中,广义TT(GTT)分割模式可以定义为水平和垂直划分。在图9A和9B中示出了示例。
提出的方法可在某些条件下应用。换句话说,当条件不满足时,不需要对分割类型发信令。
可选地,可以使用提出的方法替换现有的分割树类型。另外,提出的方法只能在某些条件下用作替代方法。
在一个示例中,条件可以包括图片和/或片类型;和/或块尺寸;和/或编解码模式;和/或一个块是否位于图片/条带/片边界处。
在一个示例中,所提出的EQT可以用与QT相同的方式处理。在这种情况下,当指示分割树类型为QT时,可能会进一步对详细的四叉树分割模式的更多标志/指示发信令。可选地,可以将EQT视为附加的分割模式。
在一个示例中,EQT或FT或GTT的分割方法的信令可能是有条件的,即在某些情况下,可能不使用一个或一些EQT/FT/GTT分割方法,并且不对与这些分割方法对应的位发信令。
2.6边界处理
在一些实施例中,提出了一种关于多功能视频编解码(VVC)的边界处理方法。AVS-3.0也采用了类似的方法。
由于VVC中的强制四叉树边界分割方案没有得到优化。一些实施例提出了使用规则块划分语法的边界划分方法,以保持连续性CABAC引擎并匹配图片边界。
多功能边界分割获得以下规则(编码器和解码器):
对于边界定位块,使用与普通块(非边界)完全相同的分割语法(例如,图10中的VTM-1.0),不需要改变语法。
如果未解析出边界CU的划分模式,则使用强制边界分割(FBP)来匹配图片边界。强制边界分割(非单一边界分割)后,不再进行分割。强制边界分割描述如下:
如果块的尺寸大于最大允许的BT尺寸,则在当前强制分割级别使用强制QT以执行FBP;
否则,如果当前CU的右下方样本低于底部图片边界,并且不扩展右边界,则在当前强制分割级别使用强制水平BT以执行FBP;
否则,如果当前CU的右下方样本位于右图片边界的右侧,并且不低于底部图片边界,则在当前强制分割级别使用强制垂直BT以执行FBP;
否则,如果当前CU的右下方样本位于右图片边界的右侧,并且低于底部图片边界,则在当前强制分割级别使用强制QT以执行FBP。
3.当前实现的问题和缺陷
1.EQT和QT/BT/TT的分割之间可能存在一些冗余。例如,对于MxN的块,可以将其划分为垂直BT三次(首先划分为两个M/2*N分割,然后对于每个M/2*N分割,进一步应用垂直BT划分)以得到四个M/4*N分割。另外,为了得到四个M/4xN分割,块可以选择直接使用如图7B所示的EQT。
2.如何有效地信令通知EQT也是个问题。
4.示例技术和实施例
为了解决这个问题以及其他问题,提出了几种方法来处理EQT的情形。实施例可以包括图片或视频编码器和解码器。
以下以逐项列出的技术应被视为解释一般概念的示例。不应狭义地解释这些实施例。此外,这些实施例可以以任何方式组合。
1.当将EQT应用于某个块时,对于由于EQT产生的每个子块,其可以进一步被划分为BT和/或EQT,并且BT和EQT可以共享由DBTMax表示的相同的最大深度值(例如,2.3.1节中的MaxBTDepth)。
a.在一个示例中,仅允许图7中所示的两种EQT。图11A和11B描绘了两个允许的EQT模式,其示出了可以进一步划分成EQT或BT的允许的EQT模式的示例。例如,一个允许的EQT模式可以包括:全宽和四分之一高的顶部分割,接着是半块宽和半块高的两个并排分割,接着是全宽和四分之一块高的底部分割(例如,图11A)。另一个允许的分割包括:全高和四分之一宽的左侧部分,接着是垂直相互堆叠的二分之一宽度宽和二分之一高度的两个分割,接着是全高和四分之一宽的右侧分割(例如。图11B)。应当理解的是,在一个方面,每个分割具有相等的面积。
b.类似地,当将BT应用到某个块时,对于由于BT产生的每个子块,其可以进一步被划分成BT和/或EQT,并且BT和EQT可以共享相同的最大深度值。
c.EQT和BT可以使用不同的深度增量处理。例如,当每个块可以被分配由DBT表示的深度值时(DBT可以从0开始)。如果用EQT划分一个块(深度值等于DBT),则将每个子块的深度值都设置为DBT+2。
d.当一个块的相关深度小于DBTMax时,它可以进一步划分为EQT或BT。
e.可选地,可以将EQT所允许的最大深度值设置为QT允许的最大深度值与BT允许的最大深度值之和。
2.当允许EQT对片/条带/图片/序列进行编码时,可以共享相同的最大允许二叉树根节点尺寸(例如,在2.3.1节中的MaxBTSize)来编解码相同的视频数据单元。
a.可选地,EQT可以使用与BT不同的最大允许的根节点尺寸。
b.在一个示例中,将最大EQT尺寸设置为MxN,例如,M=N=64或32。
c.可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将EQT的最大允许的根节点尺寸从编码器信令通知给解码器。
3.在信令通知BT或EQT的方向(例如,水平或垂直)之前,首先信令通知一个标志以指示它是BT还是EQT,并且可以进一步信令通知另一个标志以指示它使用水平或垂直划分方向。
a.在一个示例中,分割的二值化如图12所示。如下列出每个二进制索引的对应的二进制值。应当注意的是,它相当于交换表1中的所有“0”和“1”。包含一些“0”和一个“1”的二进制字符串被称为一元或截断的一元二值化方法。也就是说,如果解码的二进制为“1”,则不需要再解码更多的二进制。
b.在一个示例中,BT或EQT的方向被定义为与当前划分方向平行或垂直。
表1分割划分模式的示例
c.可选地,可以首先信令通知一个标志来指示是否使用QT或EQT或非(EQT和QT)。如果选择了非(EQT和QT),则可以进一步信令通知BT划分信息。
4.用于指示是否使用EQT或BT的标志可以是上下文编码的,并且上下文取决于当前块及其临近块的深度信息。
a.在一个示例中,临近块可以被定义为相对于当前块的上方和左侧块。
b.在一个示例中,四叉树深度和BT/EQT深度二者都可以用于标志的编解码。
c.基于其深度信息导出每个块的一个变量Dctx,例如,将其设置为(2*QT深度+BT/EQT深度)。可选地,在用于上下文选择之前,可将(2*QT深度+BT/EQT深度)进一步量化。
d.可使用三种上下文对该标志进行编解码。
(a)在一个示例中,上下文索引定义为:
((上方块的Dctx>当前块的Dctx)?1:0)+
((左侧块Dctx>当前块Dctx)?1:0)
(b)当是临近块时,其关联的Dctx被设置为0。
5.提出是否以及如何应用EQT划分可取决于要划分的块的宽度和高度(表示为W和H)。
a.在一个示例中,当W>=T1且H>=T2时,不允许所有种类的EQT划分,其中T1和T2是预定义的整数,例如,T1=T2=128或T1=T2=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T1/T2从编码器信令通知给解码器。
b.在一个示例中,当W>=T1或H>=T2时,不允许所有种类的EQT划分,其中T1和T2是预定义的整数,例如T1=T2=128或T1=T2=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T1/T2从编码器信令通知给解码器。
c.在一个示例中,当W<=T1且H<=T2时,不允许所有种类的EQT划分,其中T1和T2是预定义的整数,例如T1=T2=8或T1=T2=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T1/T2从编码器信令通知给解码器。
d.在一个示例中,当W<=T1或H<=T2时,不允许所有种类的EQT划分,其中T1和T2是预定义的整数,例如T1=T2=8或T1=T2=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T1/T2从编码器信令通知给解码器。
e.例如,在一个示例中,当W>=T时,不允许如图11A所示的水平EQT,其中T是预定义的整数,例如T=128或T=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
f.在一个示例中,当H>=T时,不允许如图11A所示的水平EQT,其中T是预定义的整数,例如T=128或T=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
g.例如,在一个示例中,当W<=T时,不允许如图11A所示的水平EQT,其中T是预定义的整数,例如T=8或T=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
h.在一个示例中,当H<=T时,不允许如图11A所示的水平EQT,其中T是预定义的整数,例如T=8或T=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
i.在一个示例中,当W>=T时,不允许如图11B所示的垂直EQT,其中T是预定义的整数,例如T=128或T=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
j.在一个示例中,当H>=T时,不允许如图11B所示的垂直EQT,其中T是预定义的整数,例如T=128或T=64。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
k.在一个示例中,当W<=T时,不允许如图11B所示的垂直EQT,其中T是预定义的整数,例如T=8或T=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
l.在一个示例中,当H<=T时,不允许如图11B所示的垂直EQT,其中T是预定义的整数,例如T=8或T=16。可选地,可以在VPS/SPS/PPS/图片标头/条带标头/片组标头/片/CTU中将T从编码器信令通知给解码器。
m.在一个示例中,当由于EQT划分产生的四个子块中的任何一个具有等于K的宽度或高度、并且在编解码器中不支持/定义K×K变换时,不允许EQT划分。
n.可选地,是否以及如何应用EQT划分可取决于由于对一个块进行EQT划分而产生的子块的宽度和/或高度(表示为W和H)。
6.提出是否以及如何应用EQT划分可取决于要划分的块的位置。
a.在一个示例中,是否以及如何应用EQT划分可取决于要划分的当前块是否在图片的边界处。在一个示例中,假设(x,y)是当前块左上位置的坐标,(PW,PH)是图片的宽度和高度,(W,H)是具有当前QT深度和BT/EQT深度的块的宽度和高度。则当y+H>PH时,当前块位于底边界;当x+W>PW时,当前块位于右边界;当y+H>PH且x+W>PW时,当前块位于右下角边界。
(a)在一个示例中,当当前块在底边界时,不允许所有种类的EQT划分;
(b)在一个示例中,当当前块在右边界时,不允许所有种类的EQT划分;
(c)在一个示例中,当当前块在右下角边界时,不允许所有种类的EQT划分;
(d)在一个示例中,当当前块在底边界时,不允许如图11A所示的水平EQT;
(e)在一个示例中,当当前块在右边界时,不允许如图11A所示的水平EQT;
(f)在一个示例中,当当前块在右下角边界时,不允许如图11A所示的水平EQT;
(g)在一个示例中,当当前块在底边界时,不允许如图11B所示的垂直EQT;
(h)在一个示例中,当当前块在右边界时,不允许如图11B所示的垂直EQT;
(i)在一个示例中,当当前块在右下角边界时,不允许如图11B所示的垂直EQT;
(j)在一个示例中,当当前块在底边界时,可以允许水平EQT和水平BT。
(k)在一个示例中,当当前块在右边界时,可以允许垂直EQT和垂直BT。
7.当不允许一个或一些种类的EQT时,以下适用。
a.在一个示例中,解析过程取决于一个或一些种类的EQT是不允许的。如果不允许一个或一些种类的EQT,则不信令通知与EQT相关的对应语法元素。
b.在另一个示例中,解析过程不取决于一个或一些种类的EQT是不允许的。无论是否允许一个或一些种类的EQT,都信令通知与EQT相关的对应语法元素。
(a)在一个示例中,如果不允许一个或一些种类的EQT,则一致性编码器不可信令通知一个或一些种类的EQT。
(b)在一个示例中,当一致性解码器解析出EQT划分,但是不允许该种类的EQT时,一致性解码器可以将EQT解释为诸如QT、BT或不划分的一些其它种类的划分。
8.在编码器侧,最大允许的EQT深度可以取决于当前图片与参考图片之间的距离,例如POC差。
a.在一个示例中,最大允许的EQT深度可以取决于当前图片的时域层索引(ID)。
b.在一个示例中,最大允许的EQT深度可以取决于当前图片是否将被其他图片参考。
c.在一个示例中,最大允许的EQT深度可以取决于量化参数。
9.在编码器侧,在一定BT/EQT深度下,当当前块及其临近块的最佳模式均为跳跃模式时,无需进一步检查用于进一步划分的率失真成本计算。
a.在一个示例中,当当前块及其临近块的最佳模式是跳跃模式或Merge模式时,无需进一步检查用于进一步划分的率失真成本计算。
b.在一个示例中,如果父块的最佳模式是跳跃模式,则无需进一步检查用于进一步划分的率失真成本计算。
10.在编码器侧,记录先前编解码的图片/条带/片的EQT划分块的平均EQT深度。当对当前视频单元进行编解码时,对于与记录的平均深度相比更大的EQT深度,无需进一步检查用于进一步划分的率失真成本计算。
a.在一个示例中,可以记录每个时域层的平均EQT值。在这种情况下,对于要编解码的每个视频数据,其仅利用相同时域层的记录平均值。
b.在一个示例中,仅记录第一时域层的平均EQT值。在这种情况下,对于要编解码的每个视频数据,其总是利用第一时域层的记录平均值。
11.在编码器侧,记录先前编解码的图片/条带/片的EQT划分块的平均尺寸。当对当前视频单元进行编解码时,对于与记录的块尺寸相比更小的块尺寸,无需进一步检查率失真成本计算。
a.在一个示例中,可以记录每个时域层的平均EQT块尺寸。在这种情况下,对于要编解码的每个视频数据,其仅利用相同时域层的记录平均值。
b.在一个示例中,仅记录第一时域层的平均EQT块尺寸。在这种情况下,对于要编解码的每个视频数据,其总是利用第一时域层的记录平均值。
5.实施例示例
在大字体文本中突出显示现有设计顶部的语法变化。
语义的示例
eqt_split_flag:指示对于一个块启用或禁用EQT的标志。
eqt_split_dir:指示是使用水平EQT还是使用垂直EQT的标志。图13A和13B示出了水平EQT分割和垂直EQT分割的四叉树分割的示例。
图14是说明可以用于实现本公开技术的各个部分的计算机系统或其他控制设备2600的结构的示例的示意图。在图14中,计算机系统2600包括通过互连2625连接的一个或多个处理器2605和存储器2610。互连2625可以表示由适当的桥、适配器或控制器连接的任何一条或多条单独的物理总线、点对点连接或两者。因此,互连2625可以包括例如系统总线、外围分量互连(PCI)总线、超传输或工业标准体系结构(ISA)总线、小型计算机系统接口(SCSI)总线、通用串行总线(USB)、IIC(I2C)总线或电气与电子工程师协会(IEEE)标准674总线(有时被称为“火线”)。
处理器2605可以包括中央处理器(CPU),来控制例如主机的整体操作。在一些实施例中,处理器2605通过执行存储在存储器2610中的软件或固件来实现这一点。处理器2605可以是或可以包括一个或多个可编程通用或专用微处理器、数字信号处理器(DSP)、可编程控制器、专用集成电路(ASIC)、可编程逻辑器件(PLD)等,或这些器件的组合。
存储器2610可以是或包括计算机系统的主存储器。存储器2610表示任何适当形式的随机存取存储器(RAM)、只读存储器(ROM)、闪存等,或这些设备的组合。在使用中,存储器2610除其他外可包含一组机器指令,当处理器2605执行该指令时,使处理器2605执行操作以实现本公开技术的实施例。
通过互连2625连接到处理器2605的还有(可选的)网络适配器2615。网络适配器2615为计算机系统2600提供与远程设备(诸如存储客户机和/或其他存储服务器)通信的能力,并且可以是例如以太网适配器或光纤通道适配器。
图15示出了可以用于实施本公开技术的各个部分的设备2700的示例实施例的框图。移动设备2700可以是笔记本电脑、智能手机、平板电脑、摄像机或其他能够处理视频的设备。移动设备2700包括处理器或控制器2701来处理数据,以及与处理器2701通信的存储器2702来存储和/或缓冲数据。例如,处理器2701可以包括中央处理器(CPU)或微控制器单元(MCU)。在一些实现中,处理器2701可以包括现场可编程门阵列(FPGA)。在一些实现中,移动设备2700包括或与图形处理单元(GPU)、视频处理单元(VPU)和/或无线通信单元通信,以实现智能手机设备的各种视觉和/或通信数据处理功能。例如,存储器2702可以包括并存储处理器可执行代码,当处理器2701执行该代码时,将移动设备2700配置为执行各种操作,例如接收信息、命令和/或数据、处理信息和数据,以及将处理过的信息/数据发送或提供给另一个数据设备,诸如执行器或外部显示器。为了支持移动设备2700的各种功能,存储器2702可以存储信息和数据,诸如指令、软件、值、图片以及处理器2701处理或引用的其他数据。例如,可以使用各种类型的随机存取存储器(RAM)设备、只读存储器(ROM)设备、闪存设备和其他合适的存储介质来实现存储器2702的存储功能。在一些实现中,移动设备2700包括输入/输出(I/O)单元2703,来将处理器2701和/或存储器2702与其他模块、单元或设备进行接口。例如,I/O单元2703可以与处理器2701和存储器2702进行接口,以利用与典型数据通信标准兼容的各种无线接口,例如,在云中的一台或多台计算机和用户设备之间。在一些实现中,移动设备2700可以通过I/O单元2703使用有线连接与其他设备进行接口。I/O单元2703可以包括无线传感器,例如用于检测远程控制信号的红外探测器,或其他合适的无线人机界面技术。移动设备2700还可以与其他外部接口(例如数据存储器)和/或可视或音频显示设备2704连接,以检索和传输可由处理器处理、由存储器存储或由显示设备2704或外部设备的输出单元上显示的数据和信息。例如,显示设备2704可以根据所公开的技术显示基于MVP修改的视频帧。
图16是视觉媒体处理的方法1600的流程图。方法1600包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行(1602)视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则将每个子块进一步划分为二叉树(BT)分割或另一个EQT分割,并且BT和另一个EQT分割二者都具有满足预定义关系的深度。
视觉媒体处理的另一个方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且其中,该规则允许基于当前块的宽度或高度,对当前块应用EQT分割处理。
视觉媒体处理的另一个方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且其中,该规则允许基于当前块的位置,对当前块应用EQT分割处理。
视觉媒体处理的另一个方法包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且其中,该规则允许EQT分割处理的最大深度取决于当前块的当前图片和当前块的参考图片之间的距离、或当前块的量化参数、或当前图片的时域层ID。
在所公开的实施例中,视频的当前块的比特流表示可以包括可以是非连续的比特流的位(视频的压缩表示),并且可以取决于标头信息(如在视频压缩技术中是已知的)。此外,当前块可以包括代表一个或多个亮度和色度分量的样本点或其旋转变体(例如,YCrCb或YUV等)。
下面的条款列表描述了一些实施例和技术,如下所示。
1.一种视觉媒体处理的方法,包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则将每个子块进一步划分为二叉树(BT)分割或另一个EQT分割,并且BT和另一个EQT分割二者都具有满足预定义关系的深度。
2.根据条款1所述的方法,其中,转换包括从比特流表示生成当前块。
3.根据条款1所述的方法,其中,转换包括从当前块生成比特流表示。
4.根据条款1至3中任一项所述的方法,其中,EQT分割处理将当前块分割为仅有的两个可能的分割中的一个。
5.根据条款4所述的方法,其中,当前块包括M x N个像素,其中M和N是整数,并且其中,两个可能的分割包括:第一分割,其包括MxN/4的顶部部分,接着是两个并排的M/2xN/2的中间部分,接着是MxN/4的底部部分;或第二分割,其包括M/4xN的左侧部分、两个M/2xN/2的中间部分和一个M/4xN的右侧部分。
6.根据条款1所述的方法,其中,预定义关系规定BT和EQT分割具有不同的值,或者预定义关系规定EQT分割的深度等于BT分割和四叉树(QT)分割的深度之和。
7.根据条款1所述的方法,其中,预定义关系规定BT和EQT分割具有相同的值。
8.根据条款1所述的方法,其中,规则规定:如果使用BT分割对当前块进行分割,则使用BT或EQT分割中的一个对每个分割进行分割。
9.根据条款1所述的方法,其中,规则规定:如果使用EQT对当前块进行分割,则每个生成的子块具有比当前块的深度值多2的深度值。
10.根据条款1至9中任一项所述的方法,其中,规则进一步规定:对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸相同的允许的根节点尺寸。
11.根据条款1至9中任一项所述的方法,其中,规则进一步规定:对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸不同的允许的根节点尺寸。
12.根据条款1至9中任一项所述的方法,其中,比特流表示被配置为在视频级、或序列级、或图片级、或图片标头级、或条带标头级、或片组标头级、或片级、或编解码树单元级指示EQT分割处理的最大允许的根节点尺寸。
13.根据条款1至11中任一项所述的方法,其中,比特流表示被配置为包括:第一字段,其指示在EQT分割或BT分割之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向。
14.根据条款11至13中任一项所述的方法,其中,划分方向相对于先前块的划分方向。
15.根据条款11至14中任一项所述的方法,其中,取决于一个或多个临近块的深度信息或当前块的深度信息,对第一字段或第二字段进行上下文编解码。
16.根据条款15所述的方法,其中,临近块是相对于当前块的上方块或左侧块。
17.根据条款15和16中任一项所述的方法,其中,一个或多个临近块的深度信息或当前块的深度信息的量化值被用于上下文编解码。
18.一种视觉媒体处理的方法,其包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的宽度或高度对当前块进行EQT分割处理。
19.根据条款18所述的方法,其中,转换包括从比特流表示生成当前块。
20.根据条款18所述的方法,其中,转换包括从当前块生成比特流表示。
21.根据条款18和20中任一项所述的方法,其中,当宽度大于或等于T1、或高度大于或等于T2时,规则不允许EQT分割,其中T1和T2是整数。
22.根据条款21所述的方法,其中,T1和T2是预定义的。
23.根据条款21所述的方法,其中,比特流表示被配置为携带T1和T2的指示。
24.根据条款23所述的方法,其中,在视频级、或序列级、或图片级、或条带标头级、或片组标头级、或片级、或编解码树单元级指示T1和T2的指示。
25.根据条款18和20中任一项所述的方法,其中,当宽度小于或等于T1、或高度小于或等于T2时,规则不允许EQT分割,其中T1和T2是整数。
26.根据条款18和20中任一项所述的方法,其中,当宽度大于或等于高度时,规则不允许EQT分割。
27.根据条款18和20中任一项所述的方法,其中,当宽度小于高度时,规则不允许EQT分割。
28.一种视觉媒体处理的方法,包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的位置对当前块进行EQT分割处理。
29.根据条款28所述的方法,其中,转换包括从比特流表示生成当前块。
30.根据条款28所述的方法,其中,转换包括从当前块生成比特流表示。
31.根据条款28和30中任一项所述的方法,其中,规则不允许对位于视频区域底部边界处的当前块进行EQT分割处理。
32.根据条款28和30中任一项所述的方法,其中,规则不允许对位于视频区域右侧边界处的当前块进行EQT分割处理。
33.根据条款28和30中任一项所述的方法,其中,该规则不允许对作为视频区域的角块的当前块进行EQT分割处理。
34.根据条款33所述的方法,其中,角对应于视频区域的右下角。
35.根据条款28所述的方法,其中,规则允许对位于视频区域底部边界处的当前块使用水平EQT分割或水平二叉树分割。
36.根据条款28所述的方法,其中,规则允许对位于视频区域右侧边界处的当前块使用水平EQT分割或水平二叉树分割。
37.根据条款1和34中任一项所述的方法,其中,如果规则不允许当前块的EQT分割处理,则从比特流表示中省略对应语法元素。
38.根据条款1和33中任一项所述的方法,其中,如果规则不允许当前块的EQT分割处理,则对应语法元素以默认值包含在比特流表示中。
39.一种视觉媒体处理的方法,包括:使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块和块的对应比特流表示之间的转换,其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且其中,该规则允许EQT分割处理的最大深度取决于当前块的当前图片和当前块的参考图片之间的距离、或当前块的量化参数、或当前图片的时域层ID。
40.根据条款39所述的方法,其中,转换包括从比特流表示生成当前块。
41.根据条款39所述的方法,其中,转换包括从当前块生成比特流表示。
42.根据条款1和40中任一项所述的方法,其中,规则规定:如果将使用跳跃模式对当前块和临近块进行编解码、或者如果当前块的编解码深度在先前编解码块的平均编解码深度之上,则禁用EQT分割处理。
43.根据条款42所述的方法,其中,在当前块所在的先前编解码图片、或条带、或片上计算平均编解码深度。
44.根据条款42所述的方法,其中,对当前块所在的时域层计算平均编解码深度。
45.一种视频处理装置,包括处理器,该处理器被配置为实现条款1至44中任一项或多项中所述的方法。
46.根据条款45所述的装置,其中,该装置是视频编码器。
47.根据条款45所述的装置,其中,该装置是视频解码器。
48.一种计算机可读介质,一种程序,该程序包括用于处理器执行条款1至44中任一项或多项中所述的方法的代码。
关于以上列出的条款和第4节中的技术列表,可以使用参数集(图片或视频参数集)来规定分割技术,或者基于规则预先规定分割技术。因此,可以减少信令通知块的分割所需的比特数。类似地,由于本文中规定的各种规则,分割决策也可以被简化,从而允许编码器或解码器的较低复杂度的实现。
此外,分割规则的位置依赖性可以基于当前块所在的视频区域(例如,条款26)。视频区域可以包括当前块或更大的部分,例如当前块所在的片、或条带、或图片。
图17是示出示例视频处理系统1700的框图,其中可以实施本文公开的各种技术。各种实现可能包括系统1700的部分或全部组件。系统1700可包括用于接收视频内容的输入1702。视频内容可以原始或未压缩格式接收,例如8位或10位多分量像素值,或者可以压缩或编解码格式接收。输入1702可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口,以及诸如Wi-Fi或蜂窝接口的无线接口。
系统1700可包括编解码组件1704,其可实现本文中所描述的各种编码或编码方法。编解码组件1704可以降低从输入1702到编解码组件1704的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时被称为视频压缩或视频转码技术。编解码组件1704的输出可以被存储,也可以通过连接的通信进行传输,如组件1706所示。输入1702处接收的视频的存储或通信比特流(或编解码)表示可由组件1708用于生成像素值或发送到显示接口1710的可显示视频。从比特流表示生成用户可观看视频的处理有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但应当理解的是,编解码工具或操作被用于编码器处,并且逆向编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文中所述的技术可实施在各种电子设备中,例如移动电话、笔记本电脑、智能手机或其他能够执行数字数据处理和/或视频显示的设备。
图18是视频处理的示例方法的流程图。方法1800包括:至少部分基于用于使用扩展四叉树(EQT)和/或BT分割处理的规则,执行(在步骤1802中)视觉媒体数据的当前块和视觉媒体数据的对应编解码表示之间的转换。
在一些实现(例如,实施例1、1(b)和2)中,可以对方法1800进行附加修改。例如,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则根据二叉树(BT)分割处理或第二EQT分割处理将每个子块进一步划分,并且进一步,其中BT处理和第二EQT分割处理二者都具有满足预定义关系的树深度。可选地,BT分割处理包括:将给定块恰好分割成两个子块;并且其中,规则规定:如果将该规则用于分割当前块,则根据另一个二叉树(BT)分割处理和/或EQT分割处理将每个子块进一步划分,其中EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且进一步,其中BT处理和EQT分割处理二者都具有满足预定义关系的深度。可选地,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则规定:如果将该规则用于分割当前块,则对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸相同的允许的根节点尺寸。
在一些实现(例如,实施例3和4)中,可以对方法1800进行附加修改。例如,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;其中,BT分割处理包括:将给定块恰好分割成两个子块;并且其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向。可选地,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;其中,BT分割处理包括:将给定块恰好分割成两个子块;其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向,并且其中,通过使用至少基于一个或多个临近块的深度信息或当前块的深度信息的上下文编解码,生成第一字段或第二字段。
在一些实现(例如,实施例5、6、7(a)和7(b))中,可以对方法1800进行附加修改。例如,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的宽度或高度,将EQT分割处理应用于当前块。可选地,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且其中,规则允许基于当前块的位置对当前块进行EQT分割处理。
现在以基于条款的格式公开一些实施例优选实现的一些特征。
1.一种视觉媒体处理的方法,包括:
至少部分基于用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且
其中,规则规定:如果将该规则用于分割当前块,则根据二叉树(BT)分割处理或第二EQT分割处理将每个子块进一步划分,并且进一步,其中BT处理和第二EQT分割处理二者都具有满足预定义关系的树深度。
2.根据条款1所述的方法,其中,预定义关系规定:BT处理和第二EQT分割处理共享相同的最大树深度。
3.根据条款1至2中任一项或多项所述的方法,其中,第二EQT分割处理将当前块分割为仅有的两个可能的分割中的一个。
4.根据条款3所述的方法,其中,当前块包括M x N个像素,其中M和N是整数,并且其中,两个可能的分割包括:第一分割,其包括MxN/4的顶部部分,接着是两个并排的M/2xN/2的中间部分,接着是MxN/4的底部部分;或第二分割,其包括M/4xN的左侧部分、两个相互堆叠的M/2xN/2的中间部分和一个M/4xN的右侧部分。
5.一种视觉媒体处理的方法,包括:
至少部分基于用于使用BT分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,BT分割处理包括:将给定块恰好分割成两个子块;并且
其中,规则规定:如果将该规则用于分割当前块,则根据另一个二叉树(BT)分割处理和/或EQT分割处理将每个子块进一步划分,其中EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸,并且进一步,其中BT处理和EQT分割处理二者都具有满足预定义关系的深度。
6.根据条款1至5中任一项或多项所述的方法,其中,预定义关系规定:在根据BT和/或EQT分割将一个块划分为子块后,BT和EQT分割具有不同的树深度增量值。
7.根据条款5至6中任一项或多项所述的方法,其中,预定义关系规定:如果给定块的树深度小于最大树深度,则根据BT分割处理和/或EQT分割处理将给定子块进一步划分。
8.根据条款7所述的方法,其中,预定义关系规定:EQT分割的最大树深度等于BT分割的最大树深度和四叉树(QT)分割的最大树深度之和。
9.根据条款1所述的方法,其中,规则规定:如果使用EQT分割处理对当前块进行分割,则每个生成的子块具有比当前块的深度值多2的深度值。
10.一种视觉媒体处理的方法,包括:
至少部分基于用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且
其中,规则规定:如果将该规则用于分割当前块,则对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸相同的允许的根节点尺寸。
11.根据条款10所述的方法,其中,规则进一步规定:对片、或条带、或图片、或图片序列中的所有块,使用与用于二叉树分割的根节点尺寸不同的允许的根节点尺寸。
12.根据条款10所述的方法,其中,允许的根节点尺寸是最大根节点尺寸,并且其中,编解码表示被配置为:在视频级、或序列级、或图片级、或图片标头级、或条带标头级、或片组标头级、或片级、或编解码树单元级指示EQT分割处理的最大允许的根节点尺寸。
13.根据条款10所述的方法,其中,规则进一步规定了EQT分割处理的最大尺寸。
14.根据条款13所述的方法,其中,EQT分割处理的最大尺寸为32。
15.根据条款13所述的方法,其中,EQT分割处理的最大尺寸为64。
16.一种视觉媒体处理的方法,包括:
至少部分基于用于使用EQT分割处理或BT分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;
其中,BT分割处理包括:将给定块恰好分割成两个子块;
其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向。
17.根据条款16所述的方法,其中,编解码表示包括如下所示的分割划分模式表:
18.根据条款16所述的方法,其中,编解码表示被配置为包括第三字段,其指示在启用EQT/BT分割处理或没有进一步划分之间的一个的当前块的分割,并且其中,在信令通知第一字段和第二字段之前信令通知第三字段。
19.根据条款18所述的方法,还包括:
在确定第三字段指示没有进一步划分时,在编解码表示中禁用第一字段和第二字段的信令通知。
20.根据条款18所述的方法,还包括:
在确定第三字段指示启用EQT/BT分割处理时,在编解码表示中信令通知第一字段和第二字段。
21.根据条款16所述的方法,其中,编解码表示被配置为包括第四字段,其指示在QT分割处理或非QT分割处理中的一个的当前块的分割,并且其中,在信令通知第一字段和第二字段之前信令通知第四字段。
22.根据条款16所述的方法,还包括:
在确定第四字段指示使用QT分割处理时,在编解码表示中禁用第一字段和第二字段的信令通知。
23.根据条款21和22中任一项或多项所述的方法,其中,在信令通知第三字段之前信令通知第四字段。
24.根据条款21所述的方法,还包括:
在确定第四字段指示使用QT分割处理时,在编解码表示中禁用第三字段的信令通知。
25.根据条款21所述的方法,还包括:
在确定第四字段指示使用非QT分割处理时,在编解码表示中信令通知第三字段。
26.根据条款16所述的方法,其中,在信令通知第二字段和第三字段之前信令通知第一字段。
27.根据条款16所述的方法,其中,如果第一字段指示将EQT分割处理应用于当前视频块,则信令通知第二字段以指示应用水平EQT或垂直EQT中的哪一个。
28.根据条款27所述的方法,其中,水平EQT将一个尺寸为W x H的块划分成每个尺寸为W/4x H的第一组两个块、以及每个尺寸为W/2x H/2的第二组两个块。
29.根据条款27所述的方法,其中,垂直EQT将一个尺寸为W x H的块划分成每个尺寸为W x H/4的第一组两个块、以及每个尺寸为W/2x H/2的第二组两个块。
30.一种视觉媒体处理的方法,包括:
至少部分基于用于使用EQT分割处理或BT分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;
其中,BT分割处理包括:将给定块恰好分割成两个子块;
其中,编解码表示被配置为包括:第一字段,其指示在EQT分割或BT分割处理之间的当前块的分割;以及第二字段,其指示在水平和垂直方向之间的当前块的划分方向,并且
其中,通过使用至少基于一个或多个临近块的深度信息或当前块的深度信息的上下文编解码,生成第一字段或第二字段。
31.根据条款30所述的方法,其中,一个或多个临近块是相对于当前块的空域上方的块或空域左侧的块。
32.根据条款30至31中任一项或多项所述的方法,其中,一个或多个临近块的深度信息或当前块的深度信息对应于QT分割处理的深度、BT分割处理的深度、或与规则相关联的四叉树分割处理的深度。
33.根据条款30至32中任一项或多项所述的方法,其中,一个或多个临近块的深度信息或当前块的深度信息的量化值被用于上下文编解码。
34.根据条款30至32中任一项或多项所述的方法,其中,规则规定:如果将规则用于分割当前块,则根据另一个二叉树(BT)分割处理和/或另一个EQT分割处理进一步划分每个子块。
35.一种视觉媒体处理的方法,包括:
使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且
其中,规则允许基于当前块的宽度或高度,将EQT分割处理应用于当前块。
36.根据条款35所述的方法,其中,当当前块的宽度大于或等于T1,或者当前块的高度大于或等于T2时,规则不允许EQT分割处理,其中T1和T2是整数。
37.根据条款35所述的方法,其中,当当前块的高度大于或等于T1,并且当前块的宽度大于或等于T2时,规则不允许EQT分割处理,其中T1和T2是整数。
38.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的宽度小于或等于T1,或者当前块的高度小于或等于T2时,不允许EQT分割,其中T1和T2是整数。
39.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的高度小于或等于T1,或者当前块的宽度小于或等于T2时,不允许EQT分割,其中T1和T2是整数。
40.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的宽度大于或等于T1时,不允许水平EQT分割,其中所述水平EQT分割将一个尺寸为W x H的块划分为每个尺寸为W/4x H的第一组两个块、以及每个尺寸为W/2x H/2的第二组两个块。
41.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的高度大于或等于T1时,不允许水平EQT分割,其中,水平EQT分割将一个尺寸为W×H的块划分为每个尺寸为W/4×H的第一组两个块、以及每个尺寸为W/2×H/2的第二组两个块。
42.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的宽度小于T1时,不允许垂直EQT分割,其中,垂直EQT分割将一个尺寸为W x H的块划分为每个尺寸为W x H/4的第一组两个块、以及每个尺寸为W/2x H/2的第二组两个块。
43.根据条款35至37中任一项或多项所述的方法,其中,规则规定:当当前块的高度小于T1时,不允许垂直EQT分割,其中,垂直EQT分割将一个尺寸为W x H的块划分为每个尺寸为W x H/4的第一组两个块、以及每个尺寸为W/2x H/2的第二组两个块。
44.根据条款35至39中任一项或多项所述的方法,其中,规则规定当四个子块中的至少一个具有等于K的宽度或高度时,不允许EQT分割,并且其中,在转换期间不支持K×K变换的应用。
45.根据条款35至44中任一项或多项所述的方法,其中,规则规定基于子块尺寸,有条件地允许或不允许EQT分割。
46.根据条款36至45中任一项或多项所述的方法,其中,T1和/或T2是预定义的量。
47.根据条款36至45中任一项或多项所述的方法,其中,编解码表示被配置为包括T1和/或T2的指示。
48.根据条款47所述的方法,其中,T1和/或T2的指示包括在视频级、序列级、图片级、条带标头级、片组标头级、片级或编解码树单元级。
49.一种视觉媒体处理的方法,包括:
使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应比特流表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且
其中,规则允许基于当前块的位置,对当前块进行EQT分割处理。
50.根据条款49所述的方法,其中,规则不允许对位于视频区域的底部边界处的当前块进行EQT分割处理。
51.根据条款49至50中任一项或多项所述的方法,其中,规则不允许对位于视频区域的右侧边界处的当前块进行EQT分割处理。
52.根据条款49至50中任一项或多项所述的方法,其中,规则不允许对位于视频区域的角处的当前块进行EQT分割处理。
53.根据条款52所述的方法,其中,角对应于视频区域的右下角。
54.根据条款49所述的方法,其中,当当前块位于视频区域的底部边界处时,规则允许使用当前块的水平EQT分割或水平二叉树分割。
55.根据条款49所述的方法,其中,当当前块位于视频区域的右侧边界处时,规则允许使用当前块的水平EQT分割或水平二叉树分割。
56.根据条款50至54中任一项或多项所述的方法,其中,视频区域是包括当前块的图片。
57.一种视觉媒体处理的方法,包括:
使用用于使用扩展四叉树(EQT)分割处理的规则,执行视觉媒体数据的当前块与视觉媒体数据的对应编解码表示之间的转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块的尺寸不同于给定块宽度的一半乘以给定块高度的一半;以及
其中,如果规则不允许当前块的EQT分割处理,则将从编解码表示中省略与EQT分割处理相关联的对应语法元素。
58.一种视觉媒体处理的方法,包括:
使用用于使用扩展四叉树(EQT)分割处理的规则,在视觉媒体数据的当前块和块的对应编解码表示之间执行转换,
其中,EQT分割处理包括:将给定块恰好分割成四个子块,其中至少一个子块具有与给定块的二分之一宽度乘以给定块的二分之一高度不同的尺寸;并且
其中,无论规则是否允许当前块的EQT分割处理,都在编解码表示中信令通知与EQT分割处理相关联的对应语法元素。
59.根据条款58所述的方法,还包括:
在确定不允许EQT分割处理时,使用语法元素来信令通知不应用EQT分割处理。
60.一种视频处理装置,包括处理器,处理器被配置为实现条款1至59中任一项或多项中所述的方法。
61.根据条款60所述的装置,其中,该装置是视频编码器。
62.根据条款60所述的装置,其中,该装置是视频解码器。
63.一种计算机可读介质,一种程序,该程序包括用于处理器执行条款1至59中任一项或多项中所述的方法的代码。
所公开技术的一些实施例包括作出启用视频处理工具或模式的决策或决定。在一个示例中,当视频处理工具或模式被启用时,编码器将在视频块的处理中使用或实现该工具或模式,但不一定基于该工具或模式的使用来修改所生产的比特流。也就是说,当基于决策或决定启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知道已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说,将使用基于决策或决定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。
所公开技术的一些实施例包括作出禁用视频处理工具或模式的决策或决定。在一个示例中,当视频处理工具或模式被禁用时,编码器在将视频块转换为视频的比特流表示中将不使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知道未使用基于决策或决定而启用的视频处理工具或模式修改比特流的情况下处理比特流。
本文中描述的主题的实现和功能操作可以在各种系统、数字电子电路、或计算机软件、固件或硬件中实现,包括本说明书中所公开的结构及其结构等效体,或其中一个或多个的组合。本说明说中描述的主题的实现可以实现为一个或多个计算机程序产品,即一个或多个编解码在有形的且非易失的计算机可读介质上的计算机程序指令的模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编解码信息以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本说明书中描述的处理和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,其他实现、增强和变体可以基于本专利文件中描述和说明的内容做出。
Claims (20)
1.一种处理视频数据的方法,包括:
对于视觉媒体数据的当前视频块与所述视觉媒体数据的比特流之间的转换,根据规则确定是否对于所述当前视频块应用扩展四叉树EQT分割处理;以及
基于所述确定,执行所述转换;
其中,响应于对于所述当前视频块应用所述EQT分割处理,所述EQT分割处理将所述当前视频块恰好分割成四个子块,其中所述四个子块包括至少一个子块,其具有与所述当前视频块的二分之一宽度乘以所述当前视频块的二分之一高度不同的尺寸,所述四个子块中的第一子块和第二子块具有第一尺寸,所述四个子块中的第三子块和第四子块具有第二尺寸,并且
其中,所述规则规定在所述当前视频块超过视频区域的边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
2.根据权利要求1所述的方法,其中,所述规则规定在所述当前视频块超过视频区域的底部边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
3.根据权利要求1所述的方法,其中,所述规则规定在所述当前视频块超过视频区域的右边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
4.根据权利要求1所述的方法,其中,所述规则规定在所述当前视频块超过视频区域的右下角边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
5.根据权利要求1所述的方法,其中,所述当前视频块的高度H和宽度W是整数,并且所述第一尺寸是H/4×W,所述第二尺寸是H/2×W/2,并且
其中,在所述当前视频块超过视频区域的底部边界、右边界、或右下角边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
6.根据权利要求1所述的方法,其中,所述当前视频块的高度H和宽度W是整数,并且所述第一尺寸是H×W/4,所述第二尺寸是H/2×W/2,并且
其中,在所述当前视频块超过视频区域的底部边界、右边界、或右下角边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
7.根据权利要求1所述的方法,其中,所述视频区域是包括所述当前视频块的画面。
8.根据权利要求1所述的方法,其中,所述规则进一步规定在所述当前视频块的分割次数大于预定值的情况下,对于所述当前视频块不应用所述EQT分割处理。
9.根据权利要求1所述的方法,其中,所述EQT分割处理的最大允许根节点尺寸不同于二叉树BT分割处理的最大允许根节点尺寸。
10.根据权利要求1所述的方法,其中,所述EQT分割处理的最大允许根节点尺寸是32。
11.根据权利要求1所述的方法,其中,所述EQT分割处理的最大允许根节点尺寸是64。
12.根据权利要求1所述的方法,其中,基于第一值导出所述EQT分割处理的最大允许根节点尺寸,并且在序列级指示所述第一值。
13.根据权利要求1所述的方法,其中,在对于所述当前视频块不允许所述EQT分割处理的情况下,从所述比特流省略与所述EQT分割处理相关联的语法元素,并且其中所述EQT分割处理包括一个或多个种类的分割处理。
14.根据权利要求1所述的方法,其中,所述当前视频块的高度H和宽度W是整数,并且一个或多个种类的分割处理包括第一种类的分割处理和第二种类的分割处理的至少一个,
其中,在所述第一种类的分割处理中,所述第一尺寸是H/4×W,所述第二尺寸是H/2×W/2,并且
在所述第二种类的分割处理中,所述第一尺寸是H×W/4,所述第二尺寸是H/2×W/2。
15.根据权利要求1所述的方法,其中,所述当前视频块的高度H和宽度W是整数,其中,所述当前视频块的左上坐标表示为(x,y),并且其中,所述四个子块具有由以下给出的左上坐标和尺寸:
(i)左上坐标(x,y),尺寸H/4×W;
(ii)左上坐标(x,y+H/4),尺寸H/2×W/2;
(iii)左上坐标(x+W/2,y+H/4),尺寸H/2×W/2;以及
(iv)左上坐标(x,y+3×H/4),尺寸H/4×W。
16.根据权利要求1所述的方法,其中,所述当前视频块的高度H和宽度W是整数,其中,所述当前视频块的左上坐标表示为(x,y),并且其中,所述四个子块具有由以下给出的左上坐标和尺寸:
(i)左上坐标(x,y),尺寸H×W/4;
(ii)左上坐标(x+W/4,y),尺寸H/2×W/2;
(iii)左上坐标(x+W/4,y+H/2),尺寸H/2×W/2;以及
(iv)左上坐标(x+3×W/4,y),尺寸H×W/4。
17.根据权利要求1所述的方法,其中,响应于对于所述当前视频块应用所述EQT分割处理,所述方法还包括:
对于所述四个子块的至少一个,应用二叉树BT分割处理、三叉树TT分割处理、四叉树QT分割处理或所述EQT分割处理的至少一个;
其中,所述BT分割处理将所述四个子块的至少一个分割为两个相等尺寸的子块,其中所述QT分割处理将所述四个子块的至少一个分割为四个相等尺寸的子块,并且其中所述TT分割处理将所述四个子块的至少一个分割为三个子块。
18.一种用于处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中在由所述处理器执行所述指令时,使得所述处理器:
对于视觉媒体数据的当前视频块与所述视觉媒体数据的比特流之间的转换,根据规则确定是否对于所述当前视频块应用扩展四叉树EQT分割处理;以及
基于所述确定,执行所述转换;
其中,响应于对于所述当前视频块应用所述EQT分割处理,所述EQT分割处理将所述当前视频块恰好分割成四个子块,其中所述四个子块包括至少一个子块,其具有与所述当前视频块的二分之一宽度乘以所述当前视频块的二分之一高度不同的尺寸,所述四个子块中的第一子块和第二子块具有第一尺寸,所述四个子块中的第三子块和第四子块具有第二尺寸,并且
其中,所述规则规定在所述当前视频块超过视频区域的边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
19.一种用于存储指令的非暂时性计算机可读存储介质,所述指令使得处理器:
对于视觉媒体数据的当前视频块与所述视觉媒体数据的比特流之间的转换,根据规则确定是否对于所述当前视频块应用扩展四叉树EQT分割处理;以及
基于所述确定,执行所述转换;
其中,响应于对于所述当前视频块应用所述EQT分割处理,所述EQT分割处理将所述当前视频块恰好分割成四个子块,其中所述四个子块包括至少一个子块,其具有与所述当前视频块的二分之一宽度乘以所述当前视频块的二分之一高度不同的尺寸,所述四个子块中的第一子块和第二子块具有第一尺寸,所述四个子块中的第三子块和第四子块具有第二尺寸,并且
其中,所述规则规定在所述当前视频块超过视频区域的边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
20.一种用于存储视频的比特流的方法,包括:
根据规则确定是否对于视觉媒体数据的当前视频块应用扩展四叉树EQT分割处理;
基于所述确定,生成所述比特流;以及
将所述比特流存储在非暂时性计算机可读存储介质中;
其中,响应于对于所述当前视频块应用所述EQT分割处理,所述EQT分割处理将所述当前视频块恰好分割成四个子块,其中所述四个子块包括至少一个子块,其具有与所述当前视频块的二分之一宽度乘以所述当前视频块的二分之一高度不同的尺寸,所述四个子块中的第一子块和第二子块具有第一尺寸,所述四个子块中的第三子块和第四子块具有第二尺寸,并且
其中,所述规则规定在所述当前视频块超过视频区域的边界的情况下,对于所述当前视频块不应用所述EQT分割处理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018111990 | 2018-10-26 | ||
CNPCT/CN2018/111990 | 2018-10-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111107367A CN111107367A (zh) | 2020-05-05 |
CN111107367B true CN111107367B (zh) | 2023-12-08 |
Family
ID=68470573
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911032640.XA Active CN111107358B (zh) | 2018-10-26 | 2019-10-28 | 块分割中的冗余降低 |
CN201911032643.3A Active CN111107378B (zh) | 2018-10-26 | 2019-10-28 | 分割信息的信令通知 |
CN201911033557.4A Active CN111107367B (zh) | 2018-10-26 | 2019-10-28 | 块分割方法和装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911032640.XA Active CN111107358B (zh) | 2018-10-26 | 2019-10-28 | 块分割中的冗余降低 |
CN201911032643.3A Active CN111107378B (zh) | 2018-10-26 | 2019-10-28 | 分割信息的信令通知 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11388476B2 (zh) |
CN (3) | CN111107358B (zh) |
WO (3) | WO2020084602A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117750022A (zh) * | 2018-12-18 | 2024-03-22 | 寰发股份有限公司 | 在区块分割中条件式编码或解码视频区块的方法和装置 |
CN111355951B (zh) * | 2018-12-24 | 2023-11-10 | 华为技术有限公司 | 视频解码方法、装置及解码设备 |
CN117296319A (zh) * | 2021-04-05 | 2023-12-26 | 抖音视界有限公司 | 基于邻居的分割约束 |
CN117256152A (zh) * | 2021-04-09 | 2023-12-19 | 抖音视界有限公司 | 多个分区的相互作用 |
WO2022268207A1 (en) * | 2021-06-25 | 2022-12-29 | FG Innovation Company Limited | Device and method for partitioning blocks in video coding |
EP4254950A1 (en) * | 2022-03-31 | 2023-10-04 | Beijing Xiaomi Mobile Software Co., Ltd. | Encoding/decoding video picture partitionned in ctu grids |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218819A (zh) * | 2013-04-20 | 2013-07-24 | 复旦大学 | 基于四叉树分解的超声图像最优同质区域自动选取方法 |
WO2016090568A1 (en) * | 2014-12-10 | 2016-06-16 | Mediatek Singapore Pte. Ltd. | Binary tree block partitioning structure |
CN106537916A (zh) * | 2014-08-04 | 2017-03-22 | 高通股份有限公司 | 调色盘模式编码及解码设计 |
WO2017088170A1 (en) * | 2015-11-27 | 2017-06-01 | Mediatek Inc. | Entropy coding the binary tree block partitioning structure |
WO2017165509A1 (en) * | 2016-03-22 | 2017-09-28 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
CN108464006A (zh) * | 2015-04-01 | 2018-08-28 | 联发科技股份有限公司 | 在使用四叉树和二叉树分割的编码系统中色度分量的非正方形帧内预测的方法及装置 |
EP3383043A1 (en) * | 2017-03-27 | 2018-10-03 | Thomson Licensing | Methods and apparatus for picture encoding and decoding |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7602984B2 (en) * | 2005-09-28 | 2009-10-13 | Novell, Inc. | Adaptive method and system for encoding digital images for the internet |
WO2011127963A1 (en) * | 2010-04-13 | 2011-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sample region merging |
US8964853B2 (en) * | 2011-02-23 | 2015-02-24 | Qualcomm Incorporated | Multi-metric filtering |
US8964833B2 (en) * | 2011-07-19 | 2015-02-24 | Qualcomm Incorporated | Deblocking of non-square blocks for video coding |
US9247254B2 (en) * | 2011-10-27 | 2016-01-26 | Qualcomm Incorporated | Non-square transforms in intra-prediction video coding |
US9247251B1 (en) * | 2013-07-26 | 2016-01-26 | Google Inc. | Right-edge extension for quad-tree intra-prediction |
CN106664430A (zh) * | 2014-06-11 | 2017-05-10 | Lg电子株式会社 | 利用嵌入块分割对视频信号进行编码和解码的方法及装置 |
US10382795B2 (en) * | 2014-12-10 | 2019-08-13 | Mediatek Singapore Pte. Ltd. | Method of video coding using binary tree block partitioning |
CN104519362B (zh) | 2014-12-23 | 2017-10-17 | 电子科技大学 | 一种邻帧预测深度相似性的视频编码方法 |
US9936201B2 (en) * | 2015-01-27 | 2018-04-03 | Qualcomm Incorporated | Contexts for large coding tree units |
WO2017008263A1 (en) * | 2015-07-15 | 2017-01-19 | Mediatek Singapore Pte. Ltd. | Conditional binary tree block partitioning structure |
US10326989B2 (en) * | 2016-05-25 | 2019-06-18 | Arris Enterprises Llc | General block partitioning method |
CN116614647A (zh) * | 2016-11-08 | 2023-08-18 | 株式会社Kt | 对视频进行解码和编码的方法、发送压缩数据的方法 |
US20180139444A1 (en) * | 2016-11-16 | 2018-05-17 | Mediatek Inc. | Method and Apparatus of Video Coding Using Flexible Quadtree and Binary Tree Block Partitions |
CN110024410B (zh) * | 2016-11-25 | 2023-07-28 | 株式会社Kt | 用于对视频进行编码和解码的方法 |
EP3562154A4 (en) * | 2016-12-26 | 2019-12-25 | Nec Corporation | IMAGE CODING METHOD, IMAGE DECODING METHOD, IMAGE CODING DEVICE, IMAGE DECODING DEVICE AND PROGRAM |
US20190379914A1 (en) * | 2017-01-31 | 2019-12-12 | Sharp Kabushiki Kaisha | Systems and methods for partitioning a picture into video blocks for video coding |
KR102601268B1 (ko) * | 2017-02-24 | 2023-11-10 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
KR102390384B1 (ko) * | 2017-03-13 | 2022-04-22 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화하기 위한 장치 및 방법 |
EP3383045A1 (en) | 2017-03-27 | 2018-10-03 | Thomson Licensing | Multiple splits prioritizing for fast encoding |
CN107071497B (zh) * | 2017-05-21 | 2020-01-17 | 北京工业大学 | 一种基于时空相关性的低复杂度视频编码方法 |
WO2019234604A1 (en) * | 2018-06-05 | 2019-12-12 | Beijing Bytedance Network Technology Co., Ltd. | Extended quad-tree with asymmetric sub-blocks |
-
2019
- 2019-10-28 CN CN201911032640.XA patent/CN111107358B/zh active Active
- 2019-10-28 WO PCT/IB2019/059216 patent/WO2020084602A1/en active Application Filing
- 2019-10-28 WO PCT/IB2019/059215 patent/WO2020084601A1/en active Application Filing
- 2019-10-28 WO PCT/IB2019/059218 patent/WO2020084603A1/en active Application Filing
- 2019-10-28 CN CN201911032643.3A patent/CN111107378B/zh active Active
- 2019-10-28 CN CN201911033557.4A patent/CN111107367B/zh active Active
-
2021
- 2021-04-25 US US17/239,614 patent/US11388476B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218819A (zh) * | 2013-04-20 | 2013-07-24 | 复旦大学 | 基于四叉树分解的超声图像最优同质区域自动选取方法 |
CN106537916A (zh) * | 2014-08-04 | 2017-03-22 | 高通股份有限公司 | 调色盘模式编码及解码设计 |
WO2016090568A1 (en) * | 2014-12-10 | 2016-06-16 | Mediatek Singapore Pte. Ltd. | Binary tree block partitioning structure |
CN108464006A (zh) * | 2015-04-01 | 2018-08-28 | 联发科技股份有限公司 | 在使用四叉树和二叉树分割的编码系统中色度分量的非正方形帧内预测的方法及装置 |
WO2017088170A1 (en) * | 2015-11-27 | 2017-06-01 | Mediatek Inc. | Entropy coding the binary tree block partitioning structure |
WO2017165509A1 (en) * | 2016-03-22 | 2017-09-28 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
EP3383043A1 (en) * | 2017-03-27 | 2018-10-03 | Thomson Licensing | Methods and apparatus for picture encoding and decoding |
Also Published As
Publication number | Publication date |
---|---|
CN111107378B (zh) | 2024-05-14 |
US11388476B2 (en) | 2022-07-12 |
CN111107367A (zh) | 2020-05-05 |
CN111107358B (zh) | 2024-07-30 |
CN111107358A (zh) | 2020-05-05 |
WO2020084603A1 (en) | 2020-04-30 |
US20210250649A1 (en) | 2021-08-12 |
WO2020084601A1 (en) | 2020-04-30 |
WO2020084602A1 (en) | 2020-04-30 |
CN111107378A (zh) | 2020-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113170116B (zh) | 为帧内模式视频处理使用参考行 | |
CN111107367B (zh) | 块分割方法和装置 | |
CN113812155B (zh) | 多种帧间编解码方法之间的交互 | |
CN113632493B (zh) | 变换跳过模式中的子块变换 | |
CN110868604B (zh) | 与扩展四叉树相关的分割的二值化 | |
CN113853791B (zh) | 数字视频中的变换旁路编解码残差块 | |
KR20220036937A (ko) | 인트라 블록 복사 가상 버퍼에 대한 매핑 제한 | |
CN115004697A (zh) | 来自多个跨分量的预测 | |
CN110662050B (zh) | 处理视频数据的方法、装置及存储介质 | |
CN111107368B (zh) | 用于分割树决定的快速方法 | |
KR102595146B1 (ko) | 비디오 인코더, 비디오 디코더 및 그에 대응하는 방법 | |
CN113557746B (zh) | 视频编解码中的复合三叉树 | |
CN114342408B (zh) | 视频编码中帧内编码模式的扩展 | |
CN114342408A (zh) | 视频编码中帧内编码模式的扩展 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |