CN117041602A

CN117041602A - 用于对视频信号进行编码的方法、计算设备和存储介质

Info

Publication number: CN117041602A
Application number: CN202310842121.XA
Authority: CN
Inventors: 朱弘正; 陈漪纹; 修晓宇; 马宗全; 陈伟; 王祥林; 于冰
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-05-01
Filing date: 2021-04-30
Publication date: 2023-11-10
Anticipated expiration: 2041-04-30
Also published as: EP4144092A4; WO2021222813A1; EP4144092A1; CN117041602B; US20230199223A1; CN115606185A

Abstract

提供了用于对视频信号进行编码的方法、计算设备和存储介质。解码器可通过比特流接收序列参数集(SPS)级中的被排列的语法元素。SPS级中的被排列的语法元素被排列使得相关语法元素的功能在编码级的通用视频编解码VVC语法中被分组。解码器可通过比特流并且响应于多个语法元素满足预定义条件，接收紧接在多个语法元素之后的第二语法元素。解码器可通过比特流，根据多个语法元素和第二语法元素对来自比特流的视频数据执行相关语法元素功能。

Description

用于对视频信号进行编码的方法、计算设备和存储介质

本申请是申请号为202180032251.6、申请日为2021年4月30日、题目为“用于视频编解码的高级语法”的发明申请的分案申请。

技术领域

本公开涉及视频编解码和压缩。更具体地，本申请涉及适用于一个或多个视频编解码标准的视频比特流中的高级语法。

背景技术

各种视频编解码技术可以用于压缩视频数据。视频编解码是根据一个或多个视频编解码标准来执行的。例如，视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图片专家组(MPEG)编解码等。视频编解码通常使用预测方法(例如，帧间预测、帧内预测等)，预测方法利用了视频图像或序列中存在的冗余。视频编解码技术的重要目标在于将视频数据压缩为使用更低比特率的形式，同时避免或最小化视频质量的下降。

发明内容

本公开的示例提供了用于视频编解码中的高级语法的方法和装置。

根据本公开的第一方面，提供一种用于对视频信号进行解码的方法。所述方法可包括：解码器接收序列参数集SPS级中的被排列的语法元素，其中所述SPS级中的所述被排列的语法元素被排列使得相关语法元素的功能在编码级的通用视频编解码VVC语法中被分组。解码器还可响应于多个语法元素满足预定义条件，接收紧接在所述多个语法元素之后的第二语法元素。解码器还可根据所述多个语法元素和所述第二语法元素对来自比特流的视频数据执行相关语法元素功能。

根据本公开的第二方面，提供一种用于对视频信号进行解码的方法。所述方法可包括：解码器接收序列参数集SPS级中的被排列的语法元素，其中SPS级中的被排列的语法元素被排列使得帧间预测相关语法元素在编码级的通用视频编解码VVC语法中被分组。解码器还可获得比特流中的与视频块相关联的第一参考图片I⁽⁰⁰和第二参考图片I⁹¹⁾。按显示顺序，所述第一参考图片I⁽⁰⁾在当前图片之前，并且所述第二参考图片I⁽¹⁾在所述当前图片之后。解码器还可从所述第一参考图片I⁽⁰⁾中的参考块获得所述视频块的第一预测样点I⁽⁰⁾(i,j)。i和j可表示所述当前图片中的一个样点的坐标。解码器还可从所述第二参考图片I⁽¹⁾中的参考块获得所述视频块的第二预测样点I⁽¹⁾(i,j)。解码器还可基于所述SPS级中的所述被排列的语法元素、以及所述第一预测样点I⁽⁰⁾(i,j)和所述第二预测样点I⁽¹⁾(i,j)获得双向预测样点。

根据本公开的第三方面，提供一种计算设备。所述计算设备可包括：一个或多个处理器；非暂态计算机可读存储介质，存储可由所述一个或多个处理器执行的指令。所述一个或多个处理器可被配置为接收序列参数集SPS级中的被排列的语法元素。所述SPS级中的所述被排列的语法元素被排列使得相关语法元素的功能在编码级的通用视频编解码VVC语法中被分组。所述一个或多个处理器还可被配置为响应于多个语法元素满足预定义条件，接收紧接在所述多个语法元素之后的第二语法元素。所述一个或多个处理器还可被配置为根据所述多个语法元素和所述第二语法元素对来自比特流的视频数据执行相关语法元素功能。

根据本公开的第四方面，提供一种非暂态计算机可读存储介质，其上存储有指令。当所述指令被设备的一个或多个处理器执行时，所述指令可使所述设备接收序列参数集SPS级中的被排列的语法元素，其中SPS级中的被排列的语法元素被排列使得帧间预测相关语法元素在编码级的通用视频编解码VVC语法中被分组。所述指令可使所述设备获得比特流中的与视频块相关联的第一参考图片I⁽⁰⁾和第二参考图片I⁽¹⁾。按显示顺序，所述第一参考图片I⁽⁰⁾在当前图片之前，并且所述第二参考图片I⁽¹⁾在所述当前图片之后。所述指令可使所述设备从所述第一参考图片I⁽⁰⁾中的参考块获得所述视频块的第一预测样点I⁽⁰⁾(i,j)。i和j表示所述当前图片中的一个样点的坐标。所述指令可使所述设备从所述第二参考图片I⁽¹⁾中的参考块获得所述视频块的第二预测样点I⁽¹⁾(i,j)。所述指令可使所述设备基于所述SPS级中的所述被排列的语法元素、以及所述第一预测样点I⁽⁰⁾(i,j)和所述第二预测样点I⁽¹⁾(i,j)获得双向预测样点。

应当理解，上面的一般描述和下面的详细描述仅是示例性和说明性的，并不旨在限制本公开。

附图说明

附图被并入本说明书中且构成本说明书的一部分，附图示出了与本公开一致的示例并且与说明书一起用于解释本公开的原理。

图1是根据本公开的示例的编码器的框图。

图2是根据本公开的示例的解码器的框图。

图3A是说明根据本公开的示例的多类型树结构中的块分割的示图。

图3B是说明根据本公开的示例的多类型树结构中的块分割的示图。

图3C是说明根据本公开的示例的多类型树结构中的块分割的示图。

图3D是说明根据本公开的示例的多类型树结构中的块分割的示图。

图3E为说明根据本公开的示例的多类型树结构中的块分割的示图。

图4是根据本公开的示例的用于对视频信号进行解码的方法。

图5是根据本公开的示例的用于对视频信号进行解码的方法。

图6是根据本公开的示例的用于对视频信号进行解码的方法。

图7是示出根据本公开的示例的与用户接口耦接的计算环境的示图。

具体实施方式

现在将详细参照实施例，其示例在附图中示出。以下描述参考附图，其中不同附图中的相同标号表示相同或相似的元件，除非另有表示。在实施例的以下描述中阐述的实现方式不表示与本公开一致的所有实现方式。相反，它们仅是与如所附权利要求中所记载的与本公开相关的方面一致的装置和方法的示例。

本公开中使用的术语仅用于描述特定实施例的目的，并且不旨在限制本公开。如在本公开和所附权利要求中所使用的，单数形式“一种”、“一个”和“该”旨在也包括复数形式，除非上下文另有明确说明。还应当理解，本文使用的术语“和/或”旨在表示和包括一个或多个相关联的所列项目的任何或所有可能的组合。

应当理解，尽管本文可以使用术语“第一”、“第二”、“第三”等来描述各种信息，但是信息不应受这些术语的限制。这些术语仅用于将一类信息与另一类信息区分开。例如，在不脱离本公开的范围的情况下，第一信息可以被称为第二信息；并且类似地，第二信息也可以被称为第一信息。如本文所使用的，根据上下文，术语“如果”可以被理解为意指“当......时”或“一经......”或“响应于判断”。

HEVC标准的第一版本在2013年10月完成，与前一代视频编解码标准H.264/MPEGAVC相比，HEVC标准的第一版本提供大约50％的比特率节省或同等的感知质量。尽管HEVC标准提供了与其前身相比显著的编解码改进，但有证据表明可以利用额外编解码工具实现优于HEVC的编解码效率。基于此，VCEG和MPEG都开始了用于未来视频编解码标准化的新编解码技术的探索工作。ITU-T VECG和ISO/IEC MPEG在2015年10月形成了一个联合视频探索小组(JVET)，以开始对可以实现显著提高编解码效率的先进技术的重要研究。JVET通过在HEVC测试模型(HM)之上集成若干额外编解码工具，来维护一个被称为联合探索模型(JEM)的参考软件。

在2017年10月，ITU-T和ISO/IEC发布了关于具有超出HEVC的能力的视频压缩的联合提案召集(CfP)。在2018年4月，在第10次JVET会议上接收并评估了23个CfP回应，其展示了超过HEVC约40％的压缩效率增益。基于这样的评估结果，JVET发起了新项目以开发被命名为通用视频编解码(VVC)的新一代视频编解码标准。在同月，建立了一个被称为VVC测试模型(VTM)的参考软件代码库，用于展示VVC标准的参考实现。

与HEVC类似，VVC建立在基于块的混合视频编解码框架上。

图1示出了用于VVC的基于块的视频编码器的一般示图。具体地，图1示出了典型的编码器100。编码器100具有视频输入110、运动补偿112、运动估计114、帧内/帧间模式决策116、块预测值140、加法器128、变换130、量化132、预测相关信息142、帧内预测118、图片缓冲器120、反量化134、逆变换136、加法器126、存储器124、环路滤波器122、熵编码138和比特流144。

在编码器100中，视频帧被分割为多个视频块以进行处理。对于每个给定视频块，基于帧间预测方法或帧内预测方法来形成预测。

预测残差，表示当前视频块(视频输入110的一部分)与其预测值(块预测值140的一部分)之间的差，从加法器128被发送到变换130。变换系数然后从变换130被发送到量化132以用于熵减少。量化的系数然后被馈送到熵编码138以生成压缩的视频比特流。如图1所示，来自帧内/帧间模式决策116的预测相关信息142(诸如视频块分割信息、运动矢量(MV)、参考图片索引和帧内预测模式)也通过熵编码138被馈送并保存到压缩的比特流144中。压缩的比特流144包括视频比特流。

在编码器100中，还需要解码器相关电路以重建用于预测目的的像素。首先，通过反量化134和逆变换136重建预测残差。该重建的预测残差与块预测值140组合，以生成用于当前视频块的未经滤波的重建像素。

空间预测(或“帧内预测”)使用来自与当前视频块相同的视频帧中的已编码的相邻块的样点(其被称为参考样点)的像素，来预测当前视频块。

时间预测(也被称为“帧间预测”)使用来自已编码的视频图片的重建像素，来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。用于给定编码单元(CU)或编码块的时间预测信号通常由一个或多个MV用信号表示，该一个或多个MV指示当前CU与其时间参考之间的运动量和运动方向。此外，如果支持多个参考图片，则额外发送一个参考图片索引，该参考图片索引用于标识时间预测信号来自参考图片存储装置中的哪个参考图片。

运动估计114接收视频输入110和来自图片缓冲器120的信号，并且将运动估计信号输出到运动补偿112。运动补偿112接收视频输入110、来自图片缓冲器120的信号、以及来自运动估计114的运动估计信号，并且将运动补偿信号输出到帧内/帧间模式决策116。

在执行空间和/或时间预测之后，编码器100中的帧内/帧间模式决策116例如基于率失真优化方法来选择最佳预测模式。然后从当前视频块中减去块预测值140，并且使用变换130和量化132对得到的预测残差进行去相关。得到的量化的残差系数由反量化134进行反量化并且由逆变换136进行逆变换以形成重建的残差，然后将该重建的残差加回到预测块以形成CU的重建信号。在重建的CU被放入图片缓冲器120的参考图片存储装置中并用于对未来的视频块进行编解码之前，可以对重建的CU进一步应用环路滤波122，诸如去块滤波器、样点自适应偏移(SAO)、和/或自适应环路滤波器(ALF)。为了形成输出视频比特流144，编码模式(帧间或帧内)、预测模式信息、运动信息、以及量化的残差系数全部被发送到熵编码单元138，以进一步被压缩和打包以形成比特流。

图1给出了通用的基于块的混合视频编码系统的框图。输入视频信号被逐块(称为CU)处理。在VTM-1.0中，CU可以多达128×128个像素。然而，与仅基于四叉树来分割块的HEVC不同，在VVC中，一个编码树单元(CTU)基于四叉树/二叉树/三叉树被拆分为多个CU以适应变化的局部特性。另外，HEVC中的多分割单元类型的概念被去除，也即，在VVC中不再存在CU、预测单元(PU)和变换单元(TU)的区分；相反，每个CU总是被用作用于预测和变换两者的基本单元，而无需进一步的分割。

在多类型树结构中，一个CTU首先通过四叉树结构被分割。然后，每个四叉树叶节点可以通过二叉和三叉树结构被进一步分割。

如图3A、图3B、图3C、图3D和图3E所示，存在五种拆分类型，四元分割、水平二元分割、垂直二元分割、水平三元分割和垂直三元分割。

图3A示出了图示出根据本公开的多类型树结构中的块四元分割的示图。

图3B示出了图示出根据本公开的多类型树结构中的块垂直二元分割的示图。

图3C示出了图示出根据本公开的多类型树结构中的块水平二元分割的示图。

图3D示出了图示出根据本公开的多类型树结构中的块垂直三元分割的示图。

图3E示出了图示出根据本公开的多类型树结构中的块水平三元分割的示图。

在图1中，空间预测和/或时间预测可以被执行。空间预测(或“帧内预测”)使用来自相同视频图片/条带中的已编码的相邻块的样点(其被称为参考样点)的像素，来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。时间预测(也被称为“帧间预测”或“经运动补偿的预测”)使用来自已编码视频图片的重建像素，来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。

用于给定CU的时间预测信号通常由一个或多个运动矢量(MV)用信号表示，该一个或多个运动矢量指示当前CU与其时间参考之间的运动的量和方向。此外，如果支持多个参考图片，则额外发送一个参考图片索引，其用于标识时间预测信号来自参考图片存储库中的哪个参考图片。在空间和/或时间预测之后，编码器中的模式决策块例如基于率失真优化方法来选择最佳预测模式。然后从当前视频块中被减去预测块，并且使用变换去相关预测残差并进行量化。

对量化后的残差系数进行反量化和逆变换以形成重建的残差，然后该重建的残差被加回到预测块以形成CU的重建信号。此外，在重建的CU被放入参考图片存储库中并用于对未来的视频块进行编解码之前，可以对重建的CU应用环路滤波，诸如去块滤波器、样点自适应偏移(SAO)、以及自适应环路滤波器(ALF)。为了形成输出视频比特流，编码模式(帧间或帧内)、预测模式信息、运动信息和量化的残差系数全部被发送到熵编码单元，以进一步被压缩和打包以形成比特流。

图2示出了用于VVC的视频解码器的一般框图。具体地，图2示出了典型的解码器200框图。解码器200具有比特流210、熵解码212、反量化214、逆变换216、加法器218、帧内/帧间模式选择220、帧内预测222、存储器230、环路滤波器228、运动补偿224、图片缓冲器226、预测相关信息234和视频输出232。

解码器200类似于驻留在图1的编码器100中的重建相关部分。在解码器200中，首先通过熵解码212对输入的视频比特流210进行解码，以导出量化的系数等级和预测相关信息。然后通过反量化214和逆变换216处理量化系数等级，以获得重建的预测残差。在帧内/帧间模式选择器220中实现的块预测值机制被配置为：基于经解码的预测信息来执行帧内预测222或运动补偿224。通过使用加法器218，对来自逆变换216的重建预测残差和由块预测值机制生成的预测输出进行求和，来获得一组未经滤波的重建像素。

在重建的块存储在用作参考图片存储库的图片缓冲器226中之前，重建的块可以进一步通过环路滤波器228。图片缓冲器226中的重建视频可以被发送以驱动显示设备，以及用于预测未来的视频块。在打开环路滤波器228的情况下，对这些重建的像素执行滤波操作以导出最终的重建视频输出232。

图2给出了基于块的视频解码器的一般框图。视频比特流首先在熵解码单元处被熵解码。编码模式和预测信息被发送到空间预测单元(如果被帧内编码)或时间预测单元(如果被帧间编码)以形成预测块。残差变换系数被发送到反量化单元和逆变换单元以重建残差块。然后将预测块和残差块相加在一起。重建的块在其被存储在参考图片存储库中之前可以进一步通过环路滤波。然后参考图片存储库中的重建视频被发送出去以驱动显示设备，以及用于预测未来的视频块。

通常，在VVC中应用的基本帧内预测方案与HEVC的基本帧内预测方案保持相同，除外的是在VVC中应用的基本帧内预测方案对若干模块进一步扩展和/或改进。例如，矩阵加权帧内预测(MIP)编码模式、帧内子分区(ISP)编码模式、具有广角帧内方向的扩展帧内预测、位置相关帧内预测组合(PDPC)和4抽头帧插值。本公开的主要焦点在于改进VVC标准中的现有高级语法设计。相关的背景知识在以下部分中详细描述。

与HEVC一样，VVC使用基于NAL单元的比特流结构。编解码的比特流被划分为NAL单元，当在有损分组网络上传送时，NAL单元应该小于最大传输单元尺寸。每个NAL单元由NAL单元头及其后面的NAL单元有效载荷组成。存在两个概念类别的NAL单元，含有已编码样点数据的视频编码层(VCL)NAL单元，诸如已编码条带NAL单元，以及通常属于多于一个已编码图片的含有元数据的非VCL NAL单元，或与单个已编码图片的关联将是无意义的非VCL NAL单元，诸如参数集NAL单元，或解码过程不需要信息的非VCL NAL单元，诸如SEI NAL单元。

在VVC中，引入了两字节NAL单元头，预期该设计足以支持未来的扩展。当前VVC草案规范中的NAL单元头的语法和相关联的语义分别在表1和表2中示出。如何阅读表1可以在VVC规范中找到。

表1.NAL单元头语法

表2.NAL单元头语义

表3.NAL单元类型码和NAL单元类型类别

VVC继承了HEVC的参数集概念并进行了一些修改和添加。参数集可以是视频比特流的一部分，或者可以由解码器通过其他手段(包括使用可靠信道的带外传输、编码器和解码器中的硬编解码等)接收。参数集包含从条带头部直接或间接地参考的标识，如稍后更详细地讨论的。参考过程被称为“激活”。根据参数集类型，按图片或按序列发生激活。除其他原因之外，还因为借助于比特流中的信息的位置的隐式激活(对于视频编解码器的其他语法元素是常见的)在带外传输的情况下不可用，所以引入了通过参考进行激活的概念。

引入视频参数集(VPS)以传递适用于多个层以及子层的信息。引入VPS是为了解决这些缺点以及实现多层编解码器的简洁且可扩展的高级设计。给定视频序列的每一层(不管其是否具有相同或不同序列参数集(SPS))参考相同VPS。表4中示出当前VVC草案规范中的视频参数集的语法。在本公开的附录部分中示出了如何阅读表4，这也可以在VVC规范中找到。

表4.视频参数集RBSP语法

在VVC中，SPS含有应用于已编码视频序列的所有条带的信息。已编码视频序列从作为比特流中的第一图片的瞬时解码刷新(IDR)图片或BLA图片或CRA图片开始，并且包括不是IDR图片或BLA图片的所有后续图片。比特流由一个或多个已编码视频序列组成。SPS的内容可以粗略地细分为六个类别：1)自参考(其自己的ID)；2)解码器操作点相关信息(简档、级、图片尺寸、子层数量等)；3)用于简档内的某些工具的启用标志，以及在启用工具的情况下的相关联的编解码工具参数；4)限制结构系数和变换系数编解码的灵活性的信息；5)时间可伸缩性控制；以及6)视觉可用性信息(VUI)，其包括HRD信息。在当前VVC草案规范中设置的序列参数的语法和相关联的语义分别在表5和表6中示出。如何读取表5在本公开的附录部分中示出，其也可以在VVC规范中找到。

表5.序列参数集RBSP语法

表6.序列参数集RBSP语义

VVC的图片参数集(PPS)包含可在图片之间改变的这种信息。PPS包括与HEVC中PPS的一部分大致相当的信息，包括：1)自参考；2)初始图片控制信息，诸如初始量化参数(QP)、指示某些工具或条带头部中的控制信息的使用或存在的多个标志；以及3)瓦片信息。在当前VVC草案规范中的图片参数集的语法和相关语义分别在表7和表8中示出。如何读取表7在本公开的附录部分中示出，这也可以在VVC规范中找到。

表7.图片参数集RBSP语法

表8.图片参数集RBSP语义

条带头部含有可逐条带改变的信息以及相对较小或仅对于特定条带或图片类型相关的此类图片相关信息。条带头部的大小可明显大于PPS，尤其是当条带头部中存在瓦片或波前入口点偏移且RPS、预测权重或参考图片列表修改被显式地通过信号发送时。表10中示出了当前VVC草案规范中的图片头部的语法。在本公开的附录部分中示出了如何阅读表10，这也可以在VVC规范中找到。

表10.图片头部结构语法

对语法元素的改进

在当前VVC中，当存在分别用于帧内预测和帧间预测的类似语法元素时，在一些地方，在与帧内预测相关的语法元素之前定义与帧间预测相关的语法元素。考虑到在所有图片/条带类型中允许帧内预测而不是在所有图片/条带类型中都允许帧间预测的事实，这种顺序可能不是优选的。从标准化的角度来看，总是在用于帧间预测的语法之前定义帧内预测相关语法将是有益的。

还观察到，在当前VVC中，彼此高度相关的一些语法元素以扩展方式在不同位置处被定义。从标准化的角度来看，将一些语法分组在一起也是有益的。

提出的方法

在本公开中，为了解决如“问题陈述”部分中所指出的问题，提供用于简化和/或进一步改进高级语法的现有设计的方法。注意，本公开的方法可以独立地或联合地应用。

按预测类型对分割约束语法元素进行分组

在本公开中，提出重新排列语法元素，使得在与帧间预测相关的语法元素之前定义与帧内预测相关的语法元素。根据本公开，分割约束语法元素按预测类型被分组，其中首先是帧内预测相关的语法元素，接着是帧间预测相关的语法元素。在一个实施例中，SPS中的分割约束语法元素的顺序与图片头部中的分割约束语法元素的顺序一致。在下表11中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表11提出的序列参数集RBSP语法

对双树色度语法元素进行分组

在本公开中，提出对与双树色度类型相关的语法元素进行分组。在一个实施例中，用于SPS中的双树色度的分割约束语法元素应在双树色度情况下一起被通过信号发送。在下表12中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表12.提出的序列参数集RBSP语法

如果还考虑在与帧间预测相关的语法之前定义帧内预测相关语法，则根据本公开的方法，下表13中示出VVC草案上的解码过程的另一示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表13.提出的序列参数集RBSP语法

有条件地通过信号发送帧间预测相关语法元素

如先前描述中所提及，根据当前VVC，在所有图片/条带类型中允许帧内预测，而不是在所有图片/条带类型中都允许帧间预测。根据本公开，提出了在特定编码级的VVC语法中添加标志，以指示在序列、图片和/或条带中是否允许帧间预测。在不允许帧间预测的情况下，不在对应的编码级(例如，序列、图片和/或条带级)通过信号发送帧间预测相关语法。

根据本公开，还提出在特定编码级的VVC语法中添加标志以指示在序列、图片和/或条带中是否允许诸如P条带和B条带的帧间条带。在不允许帧间条带的情况下，不在对应的编码级(例如，序列、图片和/或条带级)通过信号发送帧间条带相关语法。

在以下部分中基于所提出的帧间条带允许标志给出一些示例。并且，可以以类似的方式使用所提出的帧间预测允许标志。

当提出的帧间条带允许标志在不同级被添加时，可以以分层方式通过信号发送这些标志。当在较高级处通过信号发送的标志指示不允许帧间条带时，不需要通过信号发送较低级处的标志且可推断其为0(这意味着不允许帧间条带)。

在一个示例中，根据本公开的方法，在SPS中添加标志以指示在对当前视频序列进行编码时是否允许帧间条带。在不允许帧间条带的情况下，不在SPS中通过信号发送条带间相关语法元素。在下表14中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。应注意，存在除示例中引入的语法元素以外的语法元素。例如，存在许多帧间条带(或帧间预测工具)相关语法元素，诸如sps_weighted_pred_flag、sps_temporal_mvp_enabled_flag、sps_amvr_enabled_flag、sps_bdof_enabled_flag等；还存在与参考图片列表相关的语法元素，诸如long_term_ref_pics_flag、inter_layer_ref_pics_present_flag、sps_idr_rpl_present_flag等。与帧间预测相关的所有这些语法元素可以选择性地由所提出的标志控制。

表14.提出的序列参数集RBSP语法

7.4.3.3序列参数集RBSP语义

sps_inter_slice_allowed_flag等于0指定视频序列的所有已编码条带具有等于2的slice_type(其指示已编码条带为I条带)。sps_inter_slice_allowed_flag等于1指定视频序列中可能存在或可能不存在slice_type等于0(其指示已编码条带为P条带)或1(其指示已编码条带为B条带)的一个或多个已编码条带。

在另一示例中，根据本公开的方法，在图片参数集PPS中添加标志以指示在对与该PPS相关联的图片进行编码时是否允许帧间条带。在不允许帧间条带的情况下，不在PPS中通过信号发送所选择的帧间预测相关语法元素。

在又一示例中，根据本公开的方法，可以以分层方式通过信号发送帧间条带允许标志。在SPS中添加标志(例如sps_inter_slice_allowed_flag)以指示在对与该SPS相关联的图片进行编码时是否允许帧间条带。当sps_inter_slice_allowed_flag等于0(这意味着不允许帧间条带)时，可以省略通过信号发送图片头部中的帧间条带允许标志并将其推断为0。在下表15中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表15.提出的序列参数集RBSP语法

7.4.3.7图片头部结构语义

ph_inter_slice_allowed_flag等于0指定图片的所有已编码条带具有等于2的slice_type。ph_inter_slice_allowed_flag等于1指定图片中可能存在或可能不存在slice_type等于0或1的一个或多个已编码条带。当ph_inter_slice_allowed_flag不存在时，推断ph_inter_slice_allowed_flag的值等于0。

对帧间相关语法元素进行分组

在本公开中，提出重新排列语法元素使得帧间预测相关语法元素在特定编码级(例如，序列、图片和/或条带级)的VVC语法中被分组。根据本公开，提出重新排列与序列参数集(SPS)中的帧间条带相关的语法元素。在下表16中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表16.提出的序列参数集RBSP语法

下表17中示出了VVC草案上的解码过程的另一示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表17.提出的序列参数集RBSP语法

在又一示例中，VVC草案上的解码过程在下表18中示出。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表18.提出的序列参数集RBSP语法

在又一示例中，VVC草案上的解码过程在下表19中示出。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表19.提出的序列参数集RBSP语法

图4示出了根据本公开的用于对视频信号进行解码的方法。例如，所述方法可被应用于解码器。

在步骤410中，解码器可以通过比特流接收序列参数集(SPS)级中的被排列的语法元素。SPS级中被排列的语法元素可以被排列为使得相关语法元素的功能在编码级的通用视频编码(VVC)语法中被分组。

在步骤412中，解码器可以通过比特流并且响应于多个语法元素满足预定义条件来接收紧接在多个语法元素之后的第二语法元素。例如，多个语法元素可以包括sps_mmvd_enabled_flag标志和sps_fpel_mmvd_enabled_flag标志。例如，预定义条件可以包括sps_mmvd_enabled_flag标志等于1。

在步骤414中，解码器可以通过比特流根据多个语法元素和第二语法元素，对来自比特流的视频数据执行相关语法元素功能。

根据本公开，还提出在在特定编码级的VVC语法中添加标志以指示在序列、图片和/或条带中是否允许诸如P条带和B条带的帧间条带。在不允许帧间条带的情况下，帧间条带间相关语法不在对应的编码级(例如序列、图片和/或条带级)被通过信号发送。在一个示例中，根据本公开的方法，在SPS中添加标志sps_inter_slice_allowed_flag以指示在对当前视频序列进行编码时是否允许帧间条带。如果不允许，则不在SPS中通过信号发送帧间条带相关语法元素。VVC草案上的解码过程示例如下表20所示。添加的部分使用粗体和斜体字体显示，而删除的部分使用删除线字体显示。

表20.提出的序列参数集RBSP语法

下表21中示出了VVC草案上的解码过程的另一示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表21.提出的序列参数集RBSP语法

对相似功能语法元素进行分组

在本公开中，提出重新排列语法元素，使得类似功能(例如，帧内工具、帧间工具、屏幕内容工具、变换工具、量化工具、环路滤波器工具和/或分割工具)、相关语法元素在特定编码级(例如，序列、图片和/或条带级)的VVC语法中被分组。根据本公开，提出重新排列序列参数集(SPS)中的语法元素，使得类似功能相关语法元素进行分组。在下表23中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表23.提出的序列参数集RBSP语法

下表24中示出了VVC草案上的解码过程的另一示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表24.提出的序列参数集RBSP语法

根据本公开，提出重新排列图片参数集(PPS)中的语法元素，使得类似功能相关语法元素被分组。在下表25中示出了VVC草案上的解码过程的示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表25.提出的序列参数集RBSP语法

下表26中示出了VVC草案上的解码过程的另一示例。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表26.提出的序列参数集RBSP语法

在又一示例中，VVC草案上的解码过程在下表27中示出。对VVC草案的改变使用粗体和斜体字体示出，而删除的部分以删除线字体示出。

表27.提出的序列参数集RBSP语法

图5示出了根据本公开的用于对视频信号进行解码的方法。所述方法可例如被应用于解码器。

在步骤510中，解码器可接收SPS级中的被排列的语法元素，使得帧间预测相关语法元素在编码级的VVC语法中被分组。

在步骤512中，解码器可获得比特流中的与视频块相关联的第一参考图片I⁽⁰⁾和第二参考图片I⁽¹⁾。按照显示顺序，第一参考图片I⁽⁰⁾在当前图片之前，第二参考图片I⁽¹⁾在当前图片之后。

在步骤514中，解码器可从第一参考图片I⁽⁰⁾中的参考块获得视频块的第一预测样点I⁽⁰⁾(i,j)。i和j表示当前图片中的一个样点的坐标。

在步骤516中，解码器可从第二参考图片I⁽¹⁾中的参考块获得视频块的第二预测样点I⁽¹⁾(i,j)。

在步骤518中，解码器可基于SPS级中的被排列的语法元素、第一预测样点I⁽⁰⁾(i,j)和第二预测样点I⁽¹⁾(i,j)获得双向预测样点。

图6示出了根据本公开的用于对视频信号进行解码的方法。所述方法可例如被应用于解码器。

在步骤610中，解码器可接收包括用于已编码的视频数据的VPS、SPS、PPS、图片头部和条带头部的比特流。

在步骤612中，解码器可对VPS进行解码。

在步骤614中，解码器可对SPS进行解码并且获得SPS级中的被排列的分割约束语法元素。

在步骤616中，解码器可对PPS进行解码。

在步骤618中，解码器可对图片头部进行解码。

在步骤620中，解码器可对条带头部进行解码。

在步骤622中，解码器可基于VPS、SPS、PPS、图片头部和条带头部对视频数据进行解码。

可以使用包括一个或多个电路的装置来实现上述方法，一个或多个电路包括专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子组件。该装置可以与其他硬件或软件组件组合地使用所述电路来执行上述方法。上面公开的每个模块、子模块、单元或子单元可以至少部分地使用一个或多个电路来实现。

图7示出了与用户接口760耦接的计算环境710。计算环境710可以是数据处理服务器的一部分。计算环境710包括处理器720、存储器740和I/O接口750。

处理器720通常控制计算环境710的整体操作，诸如与显示、数据采集、数据通信和图像处理相关联的操作。处理器720可以包括一个或多个处理器来执行指令以执行上文描述的方法中的全部或一些步骤。此外，处理器720可以包括促进处理器720与其他组件之间的交互的一个或多个模块。处理器可以是中央处理单元(CPU)、微处理器、单片机、GPU等。

存储器740被配置为存储各种类型的数据，以支持计算环境710的操作。存储器740可以包括预定软件742。这种数据的示例包括用于在计算环境710上操作的任何应用或方法的指令、视频数据集、图像数据等。存储器740可以通过使用任何类型的易失性或非易失性存储器设备或其组合来实现，诸如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘。

I/O接口750提供处理器720与外围接口模块(诸如键盘、点击轮、按钮等)之间的接口。按钮可以包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口750可以与编码器和解码器耦接。

在一些实施例中，还提供了一种非暂态计算机可读存储介质，其包括多个程序，诸如被包括在存储器740中，由计算环境710中的处理器720可执行，用于执行上文描述的方法。例如，非暂态计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。

非暂态计算机可读存储介质中存储有多个程序，多个程序由具有一个或多个处理器的计算设备执行，其中多个程序在由一个或多个处理器执行时使计算设备执行上文描述的用于运动预测的方法。

在一些实施例中，计算环境710可以利用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器或其他电子组件来实现，以用于执行上述方法。

考虑到本文公开的本公开的说明书和实践，本公开的其他示例对于本领域技术人员而言将是显而易见的。本申请旨在涵盖遵循本公开的一般原理的本公开的任何变化、用途或改编，并且包括在本领域已知或惯常实践内的与本公开的这种偏离。说明书和示例旨在仅被认为是示例性的。

应当理解，本公开不限于上述和附图中示出的确切示例，并且可以在不脱离其范围的情况下进行各种修改和改变。

Claims

1.一种用于对视频信号进行编码的方法，包括：

在视频比特流中用信号发送序列参数集SPS级中的被排列的语法元素至解码器，其中所述SPS级中的所述被排列的语法元素被排列使得与预定义功能相关的语法元素在编码级被分组；

其中用信号发送序列参数集SPS级中的被排列的语法元素至解码器，包括：

响应于所述被排列的语法元素中的第一语法元素满足预定义条件，用信号发送所述被排列的语法元素中的紧接在所述第一语法元素之后的第二语法元素，其中，

所述第一语法元素和所述第二语法元素被用于触发解码器对来自所述视频比特流的视频数据执行所述预定义功能。

2.根据权利要求1所述的方法，其中所述预定义功能包括帧内工具、帧间工具、屏幕内容工具、变换工具、量化工具、环路滤波器工具或分割工具。

3.根据权利要求1所述的方法，还包括：

响应于所述第一语法元素不满足所述预定义条件，不用信号发送所述第二语法元素，其中，所述第二语法元素的值由解码器设置。

4.根据权利要求1所述的方法，其中所述第一语法元素是sps_mmvd_enabled_flag标志，所述第二语法元素是与基于运动矢量差的合并模式使用整数样点精度相关的标志，并且所述预定义条件包括sps_mmvd_enabled_flag等于1。

5.根据权利要求1所述的方法，其中所述被排列的语法元素至少包括：

sps_weighted_pred_flag标志、sps_weighted_bipred_flag标志、long_term_ref_pics_flag标志和sps_ref_wraparound_enabled_flag标志。

6.根据权利要求1所述的方法，其中所述第一语法元素是sps_affine_enabled_flag标志，所述第二语法元素是five_minus_max_num_subblock_merge_cand值或sps_affine_prof_enabled_flag标志，并且所述预定义条件包括sps_affine_enabled_flag标志等于1。

7.根据权利要求1所述的方法，其中所述第一语法元素是sps_affine_prof_enabled_flag标志，所述第二语法元素是fsps_prof_control_present_in_ph_flag标志，并且所述预定义条件包括sps_affine_prof_enabled_flag等于1。

8.根据权利要求1所述的方法，其中所述被排列的语法元素至少包括：

six_minus_max_num_merge_cand值、sps_sbt_enabled_flag标志、sps_bcw_enabled_flag标志、sps_ciip_enabled_flag标志、以及log2_parallel_merge_level_minus2值。

9.根据权利要求1所述的方法，还包括：

确定MaxNumMergeCand值大于或等于2；

用信号发送所述被排列的语法元素中的sps_gpm_enabled_flag标志；

确定sps_gpm_enabled_flag标志等于1并且MaxNumMergeCand值大于或等于3；以及

用信号发送所述被排列的语法元素中的max_num_merge_cand_minus_max_num_gpm_cand值。

10.根据权利要求1所述的方法，还包括：

用信号发送图片参数集PPS级中的被排列的语法元素至解码器，使得所述PPS中的与所述预定义功能相关的所述被排列的语法元素在编码级被分组。

11.根据权利要求10所述的方法，其中用信号发送图片参数集PPS级中的被排列的语法元素至解码器，包括：

用信号发送rpl1_idx_present_flag标志；

用信号发送pps_weighted_pred_flag标志；

用信号发送pps_weighted_bipred_flag标志；

用信号发送pps_ref_wraparound_enabled_flag标志；

确定pps_ref_wraparound_enabled_flag标志等于1；

用信号发送pps_pic_width_minus_wraparound_offset值；以及

用信号发送init_qp_minus26值。

12.根据权利要求10所述的方法，其中用信号发送图片参数集PPS级中的被排列的语法元素至解码器，还包括：

确定pps_ref_wraparound_enabled_flag不等于1；以及

不用信号发送pps_pic_width_minus_wraparound_offset，其中，pps_pic_width_minus_wraparound_offset的值由解码器设置。

13.一种计算设备，包括：

一个或多个处理器；以及

非暂态计算机可读存储介质，存储可由所述一个或多个处理器执行的指令，其中所述一个或多个处理器被配置为执行如权利要求1至12中任一项所述的用于对视频信号进行编码的方法。

14.一种非暂态计算机可读存储介质，存储用于由具有一个或多个处理器的计算设备执行的多个程序，其中所述多个程序在由所述一个或多个处理器执行时使所述计算设备执行如权利要求1至12中任一项所述的用于对视频信号进行编码的方法以产生视频比特流并将所述视频比特流存储于所述非暂态计算机可读存储介质。