[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113287317A - 并置的局部照明补偿和修改的帧间编解码工具 - Google Patents

并置的局部照明补偿和修改的帧间编解码工具 Download PDF

Info

Publication number
CN113287317A
CN113287317A CN201980068629.0A CN201980068629A CN113287317A CN 113287317 A CN113287317 A CN 113287317A CN 201980068629 A CN201980068629 A CN 201980068629A CN 113287317 A CN113287317 A CN 113287317A
Authority
CN
China
Prior art keywords
lic
prediction
mode
block
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980068629.0A
Other languages
English (en)
Other versions
CN113287317B (zh
Inventor
刘鸿彬
张莉
张凯
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN113287317A publication Critical patent/CN113287317A/zh
Application granted granted Critical
Publication of CN113287317B publication Critical patent/CN113287317B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种用于视频处理的方法,包括:基于继承规则,确定是否使用局部照明补偿(LIC)模式用于视频的视频区域的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换。LIC模式包括在该转换期间使用当前块中的照明变化的线性模型。继承规则指定从最终运动矢量表达(UMVE)模式的基本Merge候选继承LIC模式的使用,并且UMVE模式包括使用运动矢量表达,其中该运动矢量表达包括基本Merge候选和用来细化基本Merge候选的运动信息的运动矢量差。

Description

并置的局部照明补偿和修改的帧间编解码工具
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请是为了及时要求于2018年10月23日提交的国际专利申请NO.PCT/CN2018/111436和2019年1月15日提交的PCT/CN2019/071759的优先权和利益。出于根据美国法律的所有目的,前述申请的全部公开内容通过引用而并入,作为本专利的公开内容的一部分。
技术领域
本专利文件涉及视频编解码的领域。
背景技术
目前,正在努力提高当前视频编解码器技术的性能,以提供更好的压缩比或提供允许更低复杂性或并行实施方式的视频编解码和解码方案。行业专家最近提出了几种新的视频编解码工具,并且目前正在进行测试以用于确定其有效性。
发明内容
本文档提供了用于在视频编码器或解码器的实施例中结合局部照明补偿的技术。
在一个示例方面,公开了一种视频处理的方法。提供了一种视频处理方法,包括:对于视频的当前视频图片的当前块和视频的编解码表示之间的转换,确定对当前块的该转换启用局部照明补偿(Local Illumination Compensation,LIC)工具和帧内块复制(IntraBlock Copy,IBC)工具两者;以及基于该确定执行该转换。LIC工具在该转换期间使用当前块中的照明变化的线性模型,并且IBC工具使用当前视频图片的一部分用于当前块的该转换。
在另一示例方面,公开了一种视频处理的方法。确定使用规则,其中该规则指定与当前图片参考(Current Picture Referencing,CPR)模式相排斥地使用局部照明补偿(LIC)工具用于视频的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换。LIC工具包括在该转换期间使用当前块中的照明变化的线性模型,并且CPR模式包括使用包括当前块的当前图片的另一部分用于对当前块的预测。
在另一示例方面,公开了一种视频处理的方法。该视频处理方法包括:执行对于视频的当前块和视频的编解码表示之间的转换,确定对该转换启用广义双向预测(GBI)工具或多假设帧间预测工具或者对该转换启用局部照明补偿(LIC)工具;以及基于该确定执行该转换,其中LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
在另一示例方面,公开了一种视频处理的方法。该视频处理方法包括:确定使用局部照明补偿(LIC)工具与多假设预测工具用于视频的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换,其中LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
在另一示例方面,公开了一种视频处理的方法。该视频处理方法包括:确定使用互斥的局部照明补偿(LIC)工具和加权预测工具用于当前块和当前块的编解码表示之间的转换;以及基于该确定执行该转换,其中LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
在另一示例方面,公开了一种视频处理的方法。该方法包括:基于继承规则,确定是否使用局部照明补偿(LIC)模式用于视频的视频区域的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换。LIC模式包括在该转换期间使用当前块中的照明变化的线性模型。继承规则指定从最终运动矢量表达(UMVE)模式的基本Merge候选继承LIC模式的使用,并且UMVE模式包括使用运动矢量表达,其中该运动矢量表达包括基本Merge候选和用来细化基本Merge候选的运动信息的运动矢量差。
在一个另一示例方面,公开了一种视频处理的方法。该方法包括:确定使用互斥的局部照明补偿(LIC)工具和基于子块的编解码模式;以及基于该确定来执行视频的当前块和视频的编解码表示之间的转换,其中LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
在另一示例方面,公开了一种视频处理的方法。该方法确定使用互斥的局部照明补偿(LIC)工具和三角形预测模式(TPM);以及基于该确定来执行视频的当前块和视频的编解码表示之间的转换,其中LIC工具使用当前块中的照明变化的线性模型用于该转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于该转换。
在又一代表性方面,本文描述的各种技术可以被体现为存储在非暂时性计算机可读介质上的计算机程序产品。计算机程序产品包括用于执行本文描述的方法的程序代码。
在又一代表性方面,视频解码器装置可以实施如本文所述的方法。
一个或多个实施方式的细节在附件、附图和下面的描述中阐述。从说明书和附图以及权利要求书中,其他特征将是显而易见的。
附图说明
图1是用于Merge候选列表构建的推导过程的示例。
图2示出了空域Merge候选的示例位置。
图3示出了考虑用于空域Merge候选的冗余检查的候选对的示例。
图4示出了N×2N和2N×N分割的第二预测单元(Prediction Unit,PU)的示例位置。
图5是时域Merge候选的运动矢量缩放的图示。
图6示出了时域Merge候选C0和C1的候选位置的示例。
图7示出了组合的双向预测Merge候选的示例。
图8示出了运动矢量预测候选的推导过程的示例。
图9是空域运动矢量候选的运动矢量缩放的示例图示。
图10示出了用于CU(Coding Unit,编解码单元)的高级时域运动矢量预测值(Advanced Temporal Motion Vector Predictor,ATMVP)运动预测的示例。
图11示出了具有四个子块(A-D)及其邻近块(a-d)的一个CU的示例。
图12示出了平面运动矢量预测过程的示例。
图13是具有不同运动矢量(Motion Vector,MV)精度的编码的示例的流程图。
图14是应用OBMC的子块的示例图示。
图15示出了用于推导IC(Illumination Compensation,照明补偿)参数的邻近样点的示例。
图16是将编解码单元(CU)划分为两个三角形预测单元的图示。
图17示出了邻近块的位置的示例。
图18示出了CU应用第一加权因子组的示例。
图19示出了运动矢量存储实施方式的示例。
图20示出了简化仿射运动模型的示例。
图21示出了每个子块的仿射MVF(Motion Vector Field,运动矢量场)的示例。
图22示出了(a)4参数仿射模型和(b)6参数仿射模型的示例。
图23示出了用于AF_INTER的运动矢量预测值(MV)的示例。
图24A-图24B示出了AF_MERGE模式的候选的示例。
图25示出了仿射Merge模式的候选位置。
图26示出了双边匹配的示例过程。
图27示出了模板匹配的示例过程。
图28示出了帧速率上转换中单边运动估计(Motion Estimation,ME)的实施方式。
图29示出了最终运动矢量表达(Ultimate Motion Vector Expression,UMVE)搜索过程的实施例。
图30示出了UMVE搜索点的示例。
图31示出了距离索引和距离偏移映射的示例。
图32示出了光流轨迹的示例。
图33A-图33B示出了不具有块扩展的双向光流(Bi-directional Optical flow,BIO)的示例:a)块的外部的访问位置;b)使用填充以便避免额外的存储器访问和计算。
图34示出了使用基于双边模板匹配的解码器侧运动矢量细化(Decoder-sideMotion Vector Refinement,DMVR)的示例。
图35示出了双边滤波器中使用的邻近样点的示例。
图36示出了覆盖权重计算中使用的两个样点的窗口的示例。
图37示出了具有所提出的基于历史的运动矢量预测(HMVP)方法的解码流程的示例。
图38示出了所提出的HMVP方法中更新表的示例。
图39是用于实施本文档中描述的视频编解码或解码技术的硬件平台的框图。
图40A示出了用于实施本文档中描述的方法和技术的硬件平台的示例。
图40B示出了用于实施本文档中描述的方法和技术的硬件平台的另一示例。
图41A至图41B是视频处理的示例方法的流程图。
图42A至图42C是视频处理的示例方法的流程图。
图43A至图43D是视频处理的示例方法的流程图。
具体实施方式
本文档提供了几种可以体现在数字视频编码器和解码器中的技术。为了理解清楚,在本文档中使用了章节标题,并且不将每个章节中公开的技术和实施例的范围仅限制于该章节。
1.概述
本专利文档涉及视频编解码技术。具体地,它涉及视频编解码中的局部照明补偿(LIC)。它可以应用于现有的视频编解码标准,如HEVC,或即将要定案的标准(例如,多功能视频编解码(Versatile Video Coding,VVC))。它也可以应用于未来的视频编解码标准或视频编解码器。
2.视频编解码/解码技术的示例
视频编解码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演变的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4可视化,并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索组(Joint Video Exploration Team,JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(Joint Exploration Model,JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)成立,以致力于多功能视频编解码(VVC)标准,目标是与HEVC相比比特率降低50%。
VVC草案的最新版本,即多功能视频编解码(草案2),可在以下网址找到:
http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/11_Ljubljana/wg11/JVET-K1001-v7.zip
VVC的最新参考软件名为VTM,可在以下网址找到:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-2.1
2.1.HEVC/H.265中的帧间预测
每个帧间预测的PU具有针对一个或两个参考图片列表的运动参数。运动参数包括运动矢量和参考图片索引。也可以使用inter_pred_idc来信令通知对两个参考图片列表之一的使用。运动矢量可以被显式地编解码为相对于预测值的增量。
当用跳过模式对CU进行编解码时,一个PU与该CU相关联,并且不存在显著的残差系数、没有编解码的运动矢量增量或参考图片索引。规定Merge模式,由此从包括空域和时域候选的邻近PU获得当前PU的运动参数。Merge模式可以应用于任何帧间预测的PU,而不仅仅对于跳跃模式。Merge模式的可选方案是运动参数的显式传输,其中每一PU显式地信令通知运动矢量(更准确地,与运动矢量预测值相比的运动矢量差)、每个参考图片列表的对应参考图片索引和参考图片列表的使用。在本公开中,这种模式被称为高级运动矢量预测(Advanced Motion Vector Prediction,AMVP)。
当信令指示要使用两个参考图片列表之一时,从一个样点块中产生PU。这被称为“单向预测”。单向预测可用于P条带和B条带。
当信令指示要使用两个参考图片列表两者时,从两个样点块中产生PU。这被称为“双向预测”。双向预测仅可用于B条带。
以下文本提供了关于HEVC中规定的帧间预测模式的详细信息。描述将从Merge模式开始。
2.1.1.Merge模式
2.1.1.1.Merge模式的候选的推导
当使用Merge模式预测PU时,从比特流中解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。在HEVC标准中规定了该列表的构建,并且可以根据以下步骤的序列进行概述:
·步骤1:初始候选推导
o步骤1.1:空域候选推导
o步骤1.2:空域候选的冗余检查
o步骤1.3:时域候选推导
·步骤2:附加候选插入
o步骤2.1:创建双向预测候选
o步骤2.2:插入零运动候选
这些步骤也示意性地描绘在图1中。对于空域Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设每个PU的恒定数量的候选,因此当从步骤1获得的候选的数量未达到在条带头中信令通知的Merge候选的最大数量(MaxNumMergeCand)时,生成附加候选。由于候选的数量是恒定的,因此使用截断一元二值化(Truncated Unarybinarization,TU)对最佳Merge候选的索引进行编码。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
在下文中,将详细描述与上述步骤相关联的操作。
2.1.1.2.空域候选推导
在空域Merge候选的推导中,在位于图2中描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一条带或片)或者是帧内编解码的时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,从而提高编解码效率。图3示出了考虑用于空域Merge候选的冗余检查的候选对的示例。为了降低计算复杂度,在所提到的冗余检查中不考虑所有可能的候选对。相反,只考虑与图3中的箭头链接的对,并且如果用于冗余检查的对应候选没有相同的运动信息,则候选仅被添加到列表中。重复运动信息的另一源是与不同于2N×2N的分割相关联的“第二PU”。作为示例,图4分别描绘了N×2N和2N×N的情况下的第二PU。当当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构建。事实上,通过添加该候选将导致两个预测单元具有相同的运动信息,这对于在编解码单元中只具有一个PU是冗余的。类似地,当当前PU被分割为2N×N时,不考虑位置B1
2.1.1.3.时域候选推导
在该步骤中,仅一个候选被添加到列表。具体地,在该时域Merge候选的推导中,基于属于与给定参考图片列表内的当前图片具有最小POC(Picture Order Count,图片顺序计数)差的图片的并置(co-located)PU来推导缩放运动矢量。在条带头中显式地信令通知要用于推导并置PU的参考图片列表。图5是针对时域Merge候选的运动矢量缩放的图示。如在图5中由虚线所示的,获得了对于时域Merge候选的缩放运动矢量,该缩放运动矢量是使用POC距离tb和td从并置PU的运动矢量缩放的,其中tb被定义为当前图片的参考图片与当前图片之间的POC差,并且td被定义为并置图片的参考图片与并置图片之间的POC差。时域Merge候选的参考图片索引被设置为等于零。HEVC规范中描述了缩放过程的实际实现。对于B条带,两个运动矢量(一个用于参考图片列表0,并且另一个用于参考图片列表1)被获得并组合,以生成双向预测Merge候选。
在属于参考帧的并置PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图6所描绘的。如果位置C0处的PU不可用、是帧内编解码的、或者在当前CTU行(row)的外部,则使用位置C1。否则,在时域Merge候选的推导中使用位置C0
2.1.1.4.附加候选插入
除了空域和时域的Merge候选之外,存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用空域和时域的Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一初始候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,则它们将形成新的双向预测候选。作为示例,图7描绘了当原始列表(在左边)中的两个候选(其具有mvL0和refIdxL0或mvL1和refIdxL1)用于创建被添加到最终列表(在右边)的组合的双向预测Merge候选。存在许多关于组合的规则,这些规则被考虑以生成这些附加Merge候选。
插入零运动候选以填充Merge候选列表中的剩余条目,并因此达到MaxNumMergeCand容量。这些候选具有零空域位移和参考图片索引,该索引从零开始并且每次向列表中添加新的零运动候选时增加。这些候选使用的参考帧的数量对于单向预测和双向预测分别是1和2。最后,不对这些候选执行冗余检查。
2.1.1.5.用于并行处理的运动估计区域
为了加速编码过程,可以并行执行运动估计,由此同时推导给定区域内部的所有预测单元的运动矢量。从空域邻域推导Merge候选可能干扰并行处理,因为一个预测单元不能从邻近PU推导运动参数,直到其相关联的运动估计完成。为了缓和编解码效率和处理时延之间的折衷(trade-off),HEVC定义了运动估计区域(Motion Estimation Region,MER),使用“log2_parallel_merge_level_minus2”语法元素在图片参数集中信令通知MER的尺寸。当定义MER时,落入相同区域的Merge候选被标记为不可用,并且因此在列表构建中不被考虑。
2.1.2.AMVP
AMVP利用运动矢量与邻近PU的空时相关性,该空时相关性用于运动参数的显式传输。对于每个参考图片列表,通过首先检查左边、上边的时域邻近的PU位置的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度,来构建运动矢量候选列表。然后,编码器可以从候选列表中选择最佳预测值,并发送指示所选候选的对应索引。与Merge索引信令类似,使用截断一元对最佳运动矢量候选的索引进行编码。在这种情况下,要编码的最大值是2(见图8)。在接下来的章节中,将提供关于运动矢量预测候选的推导过程的细节。
2.1.2.1.AMVP候选的推导
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,最终基于位于如图2所示描绘五个不同位置的每个PU的运动矢量来推导两个运动矢量候选。
对于时域运动矢量候选推导,从基于两个不同并置位置而推导的两个候选中选择一个运动矢量候选。在产生第一空时候选列表之后,移除列表中的重复运动矢量候选。如果潜在候选的数量大于二,则从列表中移除相关联的参考图片列表内其参考图片索引大于1的运动矢量候选。如果空时运动矢量候选的数量小于二,则将附加的零运动矢量候选添加到列表。
2.1.2.2.空域运动矢量候选
在空域运动矢量候选的推导中,在从位于如图2所描绘的位置的PU中推导的五个潜在候选当中考虑最多两个候选,那些位置与运动Merge的位置相同。当前PU的左侧的推导顺序被定义为A0、A1、以及缩放A0、缩放A1。当前PU的上侧的推导顺序被定义为B0、B1、B2、缩放B0、缩放B1、缩放B2。因此对于每一侧,存在可以用作运动矢量候选的四种情况,其中两种情况不需要使用空域缩放,两种情况使用空域缩放。四种不同的情况概述如下:
·没有空域缩放
(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
·空域缩放
(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先检查非空域缩放情况,然后是空域缩放。当不管参考图片列表如何POC在邻近PU的参考图片与当前PU的参考图片之间都不同时,考虑空域缩放。如果左边候选的所有PU都不可用或者都是帧内编解码的,则允许针对上边运动矢量的缩放以帮助对左边和上边MV候选的并行推导。否则,针对上边运动矢量不允许空域缩放。
如图9所描绘的,在空域缩放过程中,以与时域缩放类似的方式来缩放邻近PU的运动矢量。主要差异在于参考图片列表和当前PU的索引被给定作为输入;实际缩放过程与时域缩放的过程相同。
2.1.2.3.时域运动矢量候选
除了参考图片索引推导之外,用于推导时域Merge候选的所有过程与用于推导空域运动矢量候选的过程相同(参见图6)。参考图片索引被信令通知给解码器。
2.2.JEM中的新的帧间预测方法
2.2.1.基于子CU的运动矢量预测
在具有QTBT的JEM中,每个CU对于每个预测方向最多可以有一个运动参数集合。通过将大CU划分为子CU并且推导大CU的所有子CU的运动信息,在编码器中考虑两个子CU级别运动矢量预测方法。可选时域运动矢量预测(Alternative Temporal Motion VectorPrediction,ATMVP)方法允许每个CU从比并置参考图片中的当前CU小的多个块中提取运动信息的多个集合。在空时运动矢量预测(Spatial-Temporal Motion Vector Prediction,STMVP)方法中,通过使用时域运动矢量预测值和空域邻近运动矢量来递归地推导子CU的运动矢量。
为了保持对于子CU运动预测的更准确的运动场,当前禁用参考帧的运动压缩。
2.2.1.1.可选时域运动矢量预测
在可选时域运动矢量预测(ATMVP)方法中,通过从比当前CU小的块提取多个运动信息(包括运动矢量和参考索引)集来修改运动矢量时域运动矢量预测(Temporal MotionVector Prediction,TMVP)。如图10所示,子CU是正方形的N×N块(N默认被设置为4)。
ATMVP分两个步骤来预测CU内的子CU的运动矢量。第一步骤是用所谓的时域矢量来识别参考图片中的对应块。参考图片也称为运动源图片。第二步骤是将当前CU划分为子CU,并从与每个子CU相对应的块中获得运动矢量以及每个子CU的参考索引,如图10所示。
在第一步骤中,参考图片和对应块由当前CU的空域邻近块的运动信息确定。为了避免邻近块的反复的扫描过程,使用当前CU的Merge候选列表中的第一Merge候选。第一可用运动矢量以及其相关联的参考索引被设置为时域矢量和运动源图片的索引。这样,在ATMVP中,与TMVP相比,可以更准确地识别对应块,其中对应块(有时称为并置块)总是相对于当前CU处于右下或中心位置。
在第二步骤中,通过向当前CU的坐标添加时域矢量,通过运动源图片中的时域矢量来识别子CU的对应块。对于每个子CU,其对应块的运动信息(覆盖中心样点的最小运动网格)被用于推导子CU的运动信息。在识别对应的N×N块的运动信息之后,以与HEVC的TMVP相同的方式将其转换成当前子CU的运动矢量和参考索引,其中运动缩放和其它过程适用。例如,解码器检查是否满足低延迟条件(即当前图片的所有参考图片的POC小于当前图片的POC),并且可能使用运动矢量MVx(例如,与参考图片列表X相对应的运动矢量)来预测每个子CU的运动矢量MVy(例如,其中X等于0或1,并且Y等于1-X)。
2.2.1.2.空时运动矢量预测(STMVP)
在该方法中,按照光栅扫描顺序递归地推导子CU的运动矢量。图11示出了这个概念。让我们考虑8×8的CU,它包含4个4×4的子CU:A、B、C和D。当前帧中的邻近的4×4块被标记为a、b、c和d。
子CU A的运动推导通过识别其两个空域邻居(neighbour)开始。第一邻居是子CUA上边的N×N块(块c)。如果这个块c不可用或是帧内编解码的,则检查子CU A上边的其它N×N块(从左到右,从块c开始)。第二邻居是子CU A左边的块(块b)。如果块b不可用或是帧内编解码的,则检查子CU A左边的其它块(从上到下,从块b开始)。从每个列表的邻近块中获得的运动信息被缩放到给定列表的第一参考帧。接下来,通过遵循如HEVC规定的TMVP推导的相同过程来推导子块A的时域运动矢量预测值(TMVP)。在位置D处的并置块的运动信息被相应地提取和缩放。最后,在检索和缩放运动信息之后,对每个参考列表单独地对所有可用的运动矢量(最多3个)求平均。平均运动矢量被分配为当前子CU的运动矢量。
2.2.1.3.子CU运动预测模式信令
子CU模式被启用作为附加Merge候选,并且不需要附加语法元素来信令通知这些模式。两个附加Merge候选被添加到每个CU的Merge候选列表以表示ATMVP模式和STMVP模式。如果序列参数集指示启用了ATMVP和STMVP,则可以使用多达七个Merge候选。附加Merge候选的编码逻辑与HM中的Merge候选的编码逻辑相同,这意味着,对于P条带或B条带中的每个CU,针对两个附加Merge候选可能还需要两次RD检查。
在JEM中,Merge索引的所有二进制位(bin)都由CABAC进行上下文编解码。而在HEVC中,仅对第一二进制位进行上下文编解码,并且对其余二进制位进行上下文旁路编解码。
2.2.2.成对的平均候选
成对的平均候选通过对当前Merge候选列表中的预定义候选对求平均而生成,并且预定义对被定义为{(0,1),(0,2),(1,2),(0,3),(1,3),(2,3)},其中数字表示Merge候选列表的Merge索引。为每个参考列表单独计算平均运动矢量。如果两个运动矢量在一个列表中可用,则即使这两个运动矢量指向不同的参考图片,也对它们求平均;如果只有一个运动矢量可用,则直接使用这个运动矢量;如果没有可用的运动矢量,则保持该列表无效。成对的平均候选取代了HEVC标准中的组合候选。
表1总结了成对的平均候选的复杂性分析。对于求平均的额外计算的最坏情况(表1中的最后一列),每一对需要4次加法和4次移位(L0和L1中的MVx和MVy),并且每一对需要4次参考索引比较(refIdx0以及refIdx1在L0和L1中有效)。共有6对,总共有24次加法,24次移位和24次参考索引比较。HEVC标准中的组合候选对每一对使用2次参考索引比较(refIdx0在L0中有效,以及refIdx1在L1中有效),共有12对,总共有24次参考索引比较。
表1:成对的平均候选的操作分析
Figure GDA0003166038010000131
2.2.3.平面运动矢量预测
在JVET-K0135中,提出了平面运动矢量预测。
为了生成平滑的细粒度运动场,图12给出了平面运动矢量预测过程的简要描述。
平面运动矢量预测通过在4×4块的基础上对水平和垂直线性插值求平均而实现,如下所示。
P(x,y)=(H×Ph(x,y)+W×Pv(x,y)+H×W)/(2×H×W) 等式(1)
W和H表示块的宽度和高度。(x,y)是当前子块相对于左上角子块的坐标。所有距离都用像素距离除以4来表示。P(x,y)是当前子块的运动矢量。
位置(x,y)的水平预测Ph(x,y)和垂直预测Pv(x,y)计算如下:
Ph(x,y)=(W-1-x)×L(-1,y)+(x+1)×R(W,y) 等式(2)
Pv(x,y)=(H-1-y)×A(x,-1)+(y+1)×B(x,H) 等式(3)
其中L(-1,y)和R(W,y)是当前块左边和右边的4×4块的运动矢量。A(x,-1)和B(x,H)是4×4块到当前块的上边和下边的运动矢量。
左列和上行邻近块的参考运动信息是从当前块的空域邻近块推导的。
右列和底行邻近块的参考运动信息推导如下。
1)推导右下时域邻近4×4块的运动信息
2)使用右下邻近4×4块的推导出的运动信息以及右上邻近4×4块的运动信息,计算右列邻近4×4块的运动矢量,如下面的等式(4)中所述。
3)使用右下邻近4×4块的推导出的运动信息以及左下邻近4×4块的运动信息,计算底行邻近4×4块的运动矢量,如下面的等式(5)中所述。
R(W,y)=((H-y-1)×AR+(y+1)×BR)/H 等式(4)
B(x,H)=((W-x-1)×BL+(x+1)×BR)/W 等式(5)
其中AR是右上的空域邻近4×4块的运动矢量,BR是右下的时域邻近4×4块的运动矢量,并且BL是左下的空域邻近4×4块的运动矢量。
从每个列表的邻近块获得的运动信息被缩放到给定列表的第一参考图片。
2.2.4.自适应运动矢量差分辨率
在HEVC中,当在条带头中的use_integer_mv_flag等于0时,以四分之一(quarter)亮度样点为单位信令通知(PU的运动矢量和预测运动矢量之间的)运动矢量差(MotionVector Difference,MVD)。在JEM中,引入了局部自适应运动矢量分辨率(LocallyAdaptive Motion Vector Resolution,LAMVR)。在JEM中,可以以四分之一亮度样点、整数亮度样点或四亮度样点为单位对MVD进行编解码。以编解码单元(CU)级别控制MVD分辨率,并且对于具有至少一个非零MVD分量的每个CU,有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标志以指示在CU中是否使用四分之一亮度样点MV精度。当第一标志(等于1)指示未使用四分之一亮度样点MV精度时,信令通知另一个标志以指示使用整数亮度样点MV精度还是四亮度样点MV精度。
当CU的第一MVD分辨率标志为零或未针对CU进行编解码(意味着CU中的所有MVD均为零)时,四分之一亮度样点MV分辨率用于CU。当CU使用整数亮度样点MV精度或四亮度样点MV精度时,CU的AMVP候选列表中的MVP被取整到对应精度。
在编码器中,CU级别的RD检查用于确定哪个MVD分辨率要用于CU。也就是说,对于每个MVD分辨率,执行三次CU级别的RD检查。为了加快编码器速度,在JEM中应用以下编码方案:
·在具有正常四分之一亮度样点MVD分辨率的CU的RD检查期间,存储当前CU(整数亮度样点准度)的运动信息。存储的运动信息(取整之后)被用作在针对具有整数亮度样点和4亮度样点MVD分辨率的相同CU的RD检查期间的进一步的小范围运动矢量细化的起始点,使得耗时的运动估计过程不会重复三次。
·有条件地调用具有4亮度样点MVD分辨率的CU的RD检查。对于CU,当整数亮度样点MVD分辨率的RD代价远大于四分之一亮度样点MVD分辨率的RD代价时,跳过对于CU的4亮度样点MVD分辨率的RD检查。
编码过程如图13所示。首先,测试1/4像素MV,计算RD代价并表示为RDCost0,然后测试整数MV,并且RD代价表示为RDCost1。如果RDCost1<th*RDCost0(其中th为正值),则测试4像素MV;否则,跳过4像素MV。基本上,在检查整数或4像素MV时已知对于1/4像素MV的运动信息和RD代价等,可重复使用该运动信息和RD代价以加速整数或4像素MV的编码过程。
2.2.5.更高的运动矢量存储精度
在HEVC中,运动矢量精度是四分之一像素(对于4:2:0视频,四分之一亮度样点和八分之一色度样点)。在JEM中,内部运动矢量存储和Merge候选的精度增加到1/16像素。较高的运动矢量精度(1/16像素)被用于用跳跃/Merge模式编解码的CU的运动补偿帧间预测。如第2.2.2章节所述,对于用正常AMVP模式编解码的CU,使用整数像素或四分之一像素运动。
具有与HEVC运动补偿插值滤波器相同的滤波器长度和归一化因子的SHVC上采样插值滤波器被用作附加分数像素位置的运动补偿插值滤波器。色度分量运动矢量精度在JEM中是1/32样点,通过使用两个邻近的1/16像素分数位置的滤波器的平均来推导1/32像素分数位置的附加插值滤波器。
2.2.6.重叠块运动补偿
重叠块运动补偿(OBMC)先前在H.263中使用过。在JEM中,与H.263不同,可以使用CU级别的语法来打开和关闭OBMC。当在JEM中使用OBMC时,除了CU的右边界和下边界之外,对于所有运动补偿(Motion Compensation,MC)块边界都执行OBMC。此外,它被应用于亮度和色度分量。在JEM中,MC块对应于编解码块。当用子CU模式(包括子CU Merge、仿射和FRUC(Frame Rate Up Conversion,帧速率上转换)模式)对CU进行编解码时,CU的每个子块是MC块。为了以统一的方式处理CU边界,在子块级别对于所有MC块边界执行OBMC,其中子块尺寸被设置为等于4×4,如图14所示。
当OBMC应用于当前子块时,除了当前运动矢量之外,四个相连的邻近子块的运动矢量(如果可用并且与当前运动矢量不相同)还用于推导当前子块的预测块。基于多个运动矢量的这些多个预测块被组合以生成当前子块的最终预测信号。
基于邻近子块的运动矢量的预测块被表示为PN,其中N表示用于邻近的上边、下边、左边和右边的子块的索引,并且基于当前子块的运动矢量的预测块被表示为PC。当PN基于包含邻近子块的与当前子块相同的运动信息的运动信息时,OBMC不是从PN执行的。否则,将PN的每个样点添加到PC中的相同样点中,即PN的四行/列被添加到PC中。加权因子{1/4,1/8,1/16,1/32}用于PN,并且加权因子{3/4,7/8,15/16,31/32}用于PC。例外情况是小的MC块(即当编解码块的高度或宽度等于4或者CU用子CU模式进行编解码时),对于这样的块,只有PN的两行/列被添加到PC中。在这种情况下,加权因子{1/4,1/8}用于PN,并且加权因子{3/4,7/8}用于PC。对于基于垂直(水平)邻近子块的运动矢量生成的PN,将PN的相同的行(列)中的样点以相同的加权因子添加到PC
在JEM中,对于尺寸小于或等于256个亮度样点的CU,信令通知CU级别标志,以指示对于当前CU是否应用了OBMC。对于尺寸大于256个亮度样点或未用AMVP模式编解码的CU,默认应用OBMC。在编码器处,当OBMC应用于CU时,其影响在运动估计阶段期间被考虑在内。使用上邻近块和左邻近块的运动信息由OBMC形成的预测信号用于补偿当前CU的原始信号的上边界和左边界,然后应用正常运动估计过程。
2.2.7.局部照明补偿
局部照明补偿(LIC)基于照明变化的线性模型,使用缩放因子a和偏移b。并且对于每个帧间模式编解码的编解码单元(CU)自适应地启用或禁用它。
当LIC应用于CU时,采用最小平方误差法以通过使用当前CU的邻近样点及其对应的参考样点来推导参数a和b。更具体地,如图15所示,使用参考图片中的CU的子采样(2:1子采样)邻近样点和对应的样点(由当前CU或子CU的运动信息识别)。IC参数被单独地推导并应用于每个预测方向。
当用Merge模式对CU进行编解码时,以类似于Merge模式下的运动信息复制的方式,从邻近块复制LIC标志;否则,为CU信令通知LIC标志,指示LIC是否适用。
当对于图片启用LIC时,需要附加的CU级别RD检查来确定是否将LIC应用于CU。当对于CU启用LIC时,绝对差的均值移除和(Mean-Removed Sum of Absolute Difference,MR-SAD)和绝对哈达玛(Hadamard)变换差的均值移除和(Mean-Removed Sum of AbsoluteHadamard-Transformed Difference,MR-SATD)(而不是SAD和SATD)分别用于整数像素运动搜索和分数像素运动搜索。
为了降低编码复杂度,在JEM中应用以下编码方案。当当前图片及其参考图片之间没有明显的照明变化时,对于整个图片禁用LIC。为了识别这种情况,在编码器处计算当前图片和当前图片的每个参考图片的直方图。如果当前图片和当前图片的每个参考图片之间的直方图差小于给定阈值,则对于当前图片禁用LIC;否则,对于当前图片启用LIC。
2.2.8.混合帧内和帧间预测
在JVET-L0100中,提出了多假设预测,其中混合帧内和帧间预测是生成多假设的一种方式。
当多假设预测被应用于改进帧内模式时,多假设预测结合一个帧内预测和一个Merge索引预测。在Merge CU中,为Merge模式信令通知一个标志,以当标志为真时从帧内候选列表中选择帧内模式。对于亮度分量,帧内候选列表从包括DC模式、平面模式、水平模式和垂直模式的4种帧内预测模式中推导,并且帧内候选列表的尺寸可以是3或4,这取决于块形状。当CU宽度大于CU高度的两倍时,水平模式不包括帧内模式列表,并且当CU高度大于CU宽度的两倍时,垂直模式从帧内模式列表中移除。使用加权平均来组合由帧内模式索引选择的一个帧内预测模式和由Merge索引选择的一个Merge索引预测。对于色度分量,DM总是在没有额外信令的情况下应用。用于组合预测的权重描述如下。当选择DC模式或平面模式,或CB宽度或高度小于4时,施加相等的权重。对于CB宽度和高度大于或等于4的那些CB,当选择水平/垂直模式时,一个CB首先被垂直/水平划分为四个等面积区域。每个权重集,表示为(w_intrai,w_interi),其中i为1至4,并且(w_intra1,w_inter1)=(6,2)、(w_intra2,w_inter2)=(5,3)、(w_intra3,w_inter3)=(3,5)和(w_intra4,w_inter4)=(2,6)将被施加于对应区域。(w_intra1,w_inter1)用于最接近参考样点的区域,并且(w_intra4,w_inter4)用于最远离参考样点的区域。然后,可以通过将两个加权预测相加并右移3位来计算组合预测。此外,可以保存预测值的帧内假设的帧内预测模式,以供后面的邻近CU参考。
2.2.9.三角形预测单元模式
三角形预测单元模式的概念是为运动补偿预测引入一种新的三角形分割。如图16所示,它沿对角线或相反的对角线方向将CU划分为两个三角形预测单元(PU)。CU中的每个三角形预测单元使用其自己的单向预测运动矢量和参考帧索引而被帧间预测,该单向预测运动矢量和参考帧索引从单个单向预测候选列表中推导。在预测三角形预测单元之后,对对角线边缘执行自适应加权过程。然后,将变换和量化过程应用于整个CU。注意,该模式仅适用于跳过模式和Merge模式。
单向预测候选列表
单向预测候选列表包括五个单向预测运动矢量候选。如图17所示,它是从CU的七个邻近块推导的,包括五个空域邻近块(1到5)和两个时域并置块(6到7)。收集七个邻近块的运动矢量并按照单向预测运动矢量、双向预测运动矢量的L0运动矢量、双向预测运动矢量的L1运动矢量以及双向预测运动矢量的L0运动矢量和L1运动矢量的平均运动矢量的顺序,将其放入单向预测候选列表。如果候选的数量少于五个,则零运动矢量被添加到列表中。
自适应加权过程
在预测每个三角形预测单元之后,将自适应加权过程应用于两个三角形预测单元之间的对角线边缘,以推导整个CU的最终预测。两个加权因子组如下所列:
·第一加权因子组:{7/8,6/8,4/8,2/8,1/8}和{7/8,4/8,1/8}分别用于亮度和色度样点;
·第二加权因子组:{7/8,6/8,5/8,4/8,3/8,2/8,1/8}和{6/8,4/8,2/8}分别用于亮度和色度样点。
基于两个三角形预测单元的运动矢量的比较来选择一个加权因子组。当两个三角形预测单元的参考图片彼此不同或者它们的运动矢量差大于16像素时,使用第二加权因子组。否则,使用第一加权因子组。示例如图18所示。
运动矢量存储
三角形预测单元的运动矢量(图19中的Mv1和Mv2)存储在4×4网格中。对于每个4×4网格,取决于4×4网格在CU中的位置,存储单向预测运动矢量或双向预测运动矢量。如图19所示,为位于非加权区域的4×4网格存储单向预测运动矢量Mv1或Mv2。另一方面,为位于加权区域的4×4网格存储双向预测运动矢量。双向预测运动矢量根据以下规则从Mv1和Mv2中推导:
1)在Mv1和Mv2具有来自不同方向(L0或L1)的运动矢量的情况下,Mv1和Mv2被简单地组合以形成双向预测运动矢量。
2)在Mv1和Mv2都来自相同的L0(或L1)方向的情况下,
2.a)如果Mv2的参考图片与L1(或L0)参考图片列表中的图片相同,则Mv2被缩放到该图片。Mv1和缩放的Mv2被组合以形成双向预测运动矢量。
2.b)如果Mv1的参考图片与L1(或L0)参考图片列表中的图片相同,则Mv1被缩放到该图片。缩放的Mv1和Mv2被组合以形成双向预测运动矢量。
2.c)否则,对于加权区域只存储Mv1。
2.2.10.仿射运动补偿预测
在HEVC中,只有平移运动模型被应用于运动补偿预测(Motion CompensationPrediction,MCP)。而在现实世界中,存在许多种运动,例如,放大/缩小、旋转、透视运动和其它不规则运动。在JEM中,应用简化的仿射变换运动补偿预测。如图20所示,块的仿射运动场由两个控制点运动矢量来描述。
块的运动矢量场(Motion Vector Field,MVF)由以下等式描述:
Figure GDA0003166038010000191
其中(v0x,v0y)是左上角控制点的运动矢量,并且(v1x,v1y)是右上角控制点的运动矢量。
为了进一步简化运动补偿预测,应用了基于子块的仿射变换预测。子块尺寸M×N由等式7推导,其中MvPre是运动矢量分数精度(在JEM中为1/16),(v2x,v2y)是根据等式6计算的左下控制点的运动矢量。
Figure GDA0003166038010000192
在由等式7推导出之后,如果需要,应该向下调整M和N,使其分别为w和h的因数(divisor)。
为了推导每个M×N子块的运动矢量,如图21所示,根据等式1计算每个子块的中心样点的运动矢量,并取整到1/16的分数精度。然后,应用2.2.5章节中提到的运动补偿插值滤波器来用推导出的运动矢量生成每个子块的预测。
在MCP之后,每个子块的高精度运动矢量被取整并保存为与正常运动矢量相同的精度。
2.2.10.1.AF_INTER模式
在JEM中,有两种仿射运动模式:AF_INTER模式和AF_MERGE模式。对于宽度和高度都大于8的CU,可以应用AF_INTER模式。在比特流中信令通知CU级别的仿射标志,以指示是否使用AF_INTER模式。在这种模式下,使用邻近块构建具有运动矢量对{(v0,v1)|v0={vA,vB,vc},v1={vD,vE}}的候选列表。如图23所示,从块A、块B或块C的运动矢量中选择v0。根据参考列表以及邻近块的参考的POC、当前块的参考的POC和当前CU的POC之间的关系,缩放来自邻近块的运动矢量。并且从邻近块D和E中选择v1的方法是类似的。如果候选列表的数量小于2,则该列表由通过复制每个AMVP候选而组成的运动矢量对来填充。当候选列表大于2时,首先根据邻近运动矢量的一致性(一对候选中两个运动矢量的相似性)对候选进行排序,并且仅保留前两个候选。RD代价检查用于确定选择哪个运动矢量对候选作为当前CU的控制点运动矢量预测(Control Point Motion Vector Prediction,CPMVP)。并且在比特流中信令通知指示候选列表中的CPMVP位置的索引。在确定当前仿射CU的CPMVP之后,应用仿射运动估计并找到控制点运动矢量(Control Point Motion Vector,CPMV)。然后,在比特流中信令通知CPMV和CPMVP的差。
在AF_INTER模式下,当使用4/6参数仿射模式时,需要2/3个控制点,并且因此需要为这些控制点编解码2/3个MVD,如图22所示。在JVET-K0337中,提出按如下方式来推导MV,即从mvd0中预测mvd1和mvd2
Figure GDA0003166038010000201
Figure GDA0003166038010000202
Figure GDA0003166038010000203
其中
Figure GDA0003166038010000204
mvdi和mv1分别是左上像素(i=0)、右上像素(i=1)或左下像素(i=2)的预测运动矢量、运动矢量差和运动矢量,如图22所示。请注意,两个运动矢量(例如,mvA(xA,yA)和mvB(xB,yB))的相加等于两个分量的单独求和,即newMV=mvA+mvB,newMV的两个分量分别设置为(xA+xB)和(yA+yB)。
2.2.10.2.AF_INTER模式下的快速仿射ME算法
在仿射模式下,需要联合确定2或3个控制点的MV。直接联合搜索多个MV在计算上很复杂。提出了一种快速仿射ME算法,并将其应用于VTM/BMS。
针对4参数仿射模型描述了快速仿射ME算法,并且该思想可以扩展到6参数仿射模型。
Figure GDA0003166038010000211
Figure GDA0003166038010000212
将(a-1)替换为a’,则运动矢量可以重写为:
Figure GDA0003166038010000213
假设两个控制点(0,0)和(0,w)的运动矢量是已知的,从等式(5)中我们可以推导仿射参数,
Figure GDA0003166038010000214
运动矢量可以以矢量形式重写为:
Figure GDA0003166038010000215
其中
Figure GDA0003166038010000216
Figure GDA0003166038010000217
P=(x,y)是像素位置。
在编码器处,迭代地推导AF_INTER的MVD。将MVi(P)表示为在位置P的第i次迭代中推导出的MV,并将dMVC i表示为在第i次迭代中为MVC更新的增量。然后,在第(i+1)次迭代中,
Figure GDA0003166038010000218
Figure GDA0003166038010000221
将Picref表示为参考图片,并且将Piccur表示为当前图片,并表示Q=P+MVi(P)。假设我们使用MSE作为匹配准则,则我们需要最小化:
Figure GDA0003166038010000222
假设
Figure GDA0003166038010000223
足够小,我们可以用1阶泰勒展开式近似地重写
Figure GDA0003166038010000224
Figure GDA0003166038010000225
如下。
Figure GDA0003166038010000226
其中,
Figure GDA0003166038010000227
表示Ei+l(P)=Piccur(P)-Picref(Q),
Figure GDA0003166038010000228
我们可以通过将误差函数的导数设置为零来推导
Figure GDA0003166038010000229
然后,可以根据
Figure GDA00031660380100002210
来计算控制点(0,0)和(0,w)的增量MV
Figure GDA00031660380100002211
Figure GDA00031660380100002212
Figure GDA00031660380100002213
Figure GDA00031660380100002214
假定这样的MVD推导过程被迭代n次,则最终MVD计算如下:
Figure GDA00031660380100002215
Figure GDA00031660380100002216
Figure GDA00031660380100002217
Figure GDA00031660380100002218
利用JVET-K0337,即从由mvd0表示的控制点(0,0)的增量MV预测由mvd1表示的控制点(0,w)的增量MV,现在实际上只对于mvd1编码
Figure GDA00031660380100002219
2.2.10.3.AF_MERGE模式
当在AF_MERGE模式下应用CU时,它从有效的邻近重构块中获得用仿射模式编解码的第一块。并且候选块的选择顺序是从左边、上边、右上、左下到左上,如图24A所示,推导包含块A的CU的左上角、右上角和左下角的运动矢量v2、v3和v4。并且根据v2、v3和v4来计算当前CU上左上角的运动矢量v0。其次,计算当前CU右上的运动矢量v1
在推导出当前CU的CPMV v0和v1之后,根据简化的仿射运动模型等式1,生成当前CU的MVF。为了识别当前CU是否用AF_MERGE模式编解码,当存在至少一个邻近块以仿射模式编解码时,在比特流中信令通知仿射标志。
图24A和图24B示出了AF_MERGE候选的示例。
在计划被采用到VTM 3.0中的JVET-L0366中,仿射Merge候选列表由以下步骤构建:
1)插入继承的仿射候选
继承的仿射候选是指候选是从其有效邻近仿射编解码块的仿射运动模型中推导的。在公共基础中,如图25所示,候选位置的扫描顺序是:A1、B1、B0、A0和B2。
在推导出候选之后,执行完全修剪过程,以检查是否已将相同候选插入列表。如果存在相同候选,则丢弃推导出的候选。
2)插入构建的仿射候选
如果仿射Merge候选列表中的候选的数量小于MaxNumAffineCand(在此稿中设置为5),则将构建的仿射候选插入候选列表中。构建的仿射候选是指通过组合每个控制点的邻近运动信息来构建候选。
控制点的运动信息首先从图25所示的指定的空域邻居和时域邻居中推导。CPk(k=1,2,3,4)代表第k个控制点。A0、A1、A2、B0、B1、B2和B3是预测CPk(k=1,2,3)的空域位置;T是预测CP4的时域位置。
CP1、CP2、CP3和CP4的坐标分别是(0,0)、(W,0)、(H,0)和(W,H),其中W和H是当前块的宽度和高度。
根据以下优先级顺序获得每个控制点的运动信息:
对于CP1,检查优先级是B2->B3->A2。如果B2可用,则使用B2。否则,如果B2可用,则使用B3。如果B2和B3都不可用,则使用A2。如果三个候选全部都不可用,则无法获得CP1的运动信息。
对于CP2,检查优先级是B1->B0
对于CP3,检查优先级是A1->A0
对于CP4,使用T。
其次,使用控制点的组合来构建仿射Merge候选。
构建6参数仿射候选需要三个控制点的运动信息。三个控制点可以从以下四个组合中选择一个({CP1,CP2,CP4}、{CP1,CP2,CP3}、{CP2,CP3,CP4}、{CP1,CP3,CP4})。组合{CP1,CP2,CP3}、{CP2,CP3,CP4}、{CP1,CP3,CP4}将转换为由左上、右上和左下控制点表示的6参数运动模型。
构建4参数仿射候选需要两个控制点的运动信息。这两个控制点可以从以下六个组合中选择一个({CP1,CP4}、{CP2,CP3}、{CP1,CP2}、{CP2,CP4}、{CP1,CP3}、{CP3,CP4})。组合{CP1,CP4}、{CP2,CP3}、{CP2,CP4}、{CP1,CP3}、{CP3,CP4}将被转换为由左上和右上控制点表示的4参数运动模型。
构建的仿射候选的组合按以下顺序插入候选列表:{CP1,CP2,CP3}、{CP1,CP2,CP4}、{CP1,CP3,CP4}、{CP2,CP3,CP4}、{CP1,CP2}、{CP1,CP3}、{CP2,CP3}、{CP1,CP4}、{CP2,CP4}、{CP3,CP4}。
对于组合的参考列表X(X为0或1),在控制点中具有最高使用率的参考索引被选择作为列表X的参考索引,并且指向差异参考图片的运动矢量将被缩放。
在推导出候选之后,执行完全修剪过程,以检查是否已将相同候选插入列表。如果存在相同候选,则推导出的候选将被丢弃。
3)用零运动矢量进行填充
如果仿射Merge候选列表中的候选的数量少于5,则具有零参考索引的零运动矢量被插入到候选列表中,直到列表满为止。
2.2.11.模式匹配运动矢量推导
模式匹配的运动矢量推导(Pattern Matched Motion Vector Derivation,PMMVD)模式是基于帧速率上转换(Frame-Rate Up Conversion,FRUC)技术的特殊Merge模式。利用该模式,在解码器侧推导块的运动信息,而不是信令通知块的运动信息。
当CU的Merge标志为真时,向CU信号通知FRUC标志。当FRUC标志为假时,信号通知Merge索引并使用常规Merge模式。当FRUC标志为真时,信号通知的额外的FRUC模式标志以指示将使用哪种方法(双边匹配或模板匹配)来推导该块的运动信息。
在编码器侧,关于是否对CU使用FRUC Merge模式的决定是基于对正常Merge候选所做的RD代价选择。即,通过使用RD代价选择来校验CU的两种匹配模式(双边匹配和模板匹配)。引起最小成本的匹配模式与其他CU模式进一步比较。如果FRUC匹配模式是最有效的模式,则对于CU将FRUC标志设置为真,并且使用相关的匹配模式。
FRUC Merge模式中的运动推导过程具有两个步骤:首先执行CU级别运动搜索,然后进行子CU级别运动细化。在CU级别,基于双边匹配或模板匹配,推导整个CU的初始运动矢量。首先,生成MV候选列表,并且选择引起最小匹配成本的候选作为进一步CU级别细化的起点。然后,在起点附近执行基于双边匹配或模板匹配的局部搜索,并且将最小匹配成本的MV结果作为整个CU的MV。随后,以推导出的CU运动矢量作为起点,进一步在子CU级别细化运动信息。
例如,对于W×HCU运动信息推导执行以下推导过程。在第一阶段,推导整个W×HCU的MV。在第二阶段,该CU进一步被划分为M×M个子CU。M的值的计算方法如(16)所示,D是预定义的划分深度,在JEM中默认设置为3。然后推导每个子CU的MV。
Figure GDA0003166038010000251
如图26所示,通过在两个不同参考图片中沿当前CU的运动轨迹找到两个块之间的最接近匹配,使用双边匹配来推导当前CU的运动信息。在连续运动轨迹的假设下,指向两个参考块的运动矢量MV0和MV1应当与当前图片和两个参考图片之间的时间距离(即TD0和TD1)成比例。作为特殊情况,当当前图片在时间上在两个参考图片之间并且从当前图片到两个参考图片的时间距离相同时,双边匹配成为基于镜像的双向MV。
如图27所示,模板匹配用于通过找到当前图片中的模板(当前CU的顶部和/或左边邻近块)与参考图片中的块(与模板的尺寸相同)之间的最接近匹配来推导当前CU的运动信息。除了上述FRUC Merge模式之外,模板匹配也应用于AMVP模式。在JEM中,正如在HEVC中所做的那样,AMVP有两个候选。通过模板匹配方法,新的候选被推导出。如果由模板匹配新推导的候选与第一现有AMVP候选不同,则将其插入AMVP候选列表的最开始处,然后将列表尺寸设置为2(意味着移除第二现有AMVP候选)。当应用于AMVP模式时,仅应用CU级别搜索。
2.2.11.1.CU级别MV候选集
在CU级别处设置的MV候选包括:
(i)如果当前CU处于AMVP模式,则为原始AMVP候选,
(ii)所有Merge候选,
(iii)在2.2.11.3章节中介绍的插值MV场中的几个MV。
(iv)顶部和左边邻近运动矢量
当使用双边匹配时,将Merge候选的每个有效MV用作输入,以生成假设双边匹配的情况下的MV对。例如,在参考列表A中,Merge候选的一个有效MV是(MVa,refa)。然后,在其他参考列表B中找到其配对的双边MV的参考图片refb,使得refa和refb在时间上位于当前图片的不同侧。如果这样的refb在参考列表B中不可用,则refb被确定为与refa不同的参考,并且其到当前图片的时间距离是列表B中的最小值。在确定refb之后,通过基于当前图片refa和refb之间的时间距离来缩放MVa来推导MVb。
来自插值MV场的四个MV也被添加到CU级别候选列表。更具体地,添加当前CU的位置(0,0)、(W/2,0)、(0,H/2)和(W/2,H/2)处的插值MV。
当FRUC应用于AMVP模式时,原始AMVP候选也被添加到CU级别MV候选集。
在CU级别,对于AMVP CU,最多将15个MV添加到候选列表,对于Merge CU,最多将13个MV添加到候选列表。
2.2.11.2.子CU级别MV候选集
在子CU级别处设置的MV候选包括:
(i)从CU级别搜索确定的MV,
(ii)顶部、左边、左上角和右上角的邻近MV,
(iii)来自参考图片的并置MV的缩放版本,
(iv)最多4个ATMVP候选,
(v)最多4个STMVP候选。
来自参考图片的缩放MV如下推导。遍历两个列表中的所有参考图片。参考图片中的子CU的并置位置处的MV被缩放到起始CU级别MV的参考。
ATMVP和STMVP候选仅限于前四个。
在子CU级别,最多将17个MV添加到候选列表中。
2.2.11.3.插值MV场的生成
在对帧进行编解码之前,基于单边ME为整个图片生成插值运动场。然后,运动场可以稍后用作CU级别或子CU级别MV候选。
首先,两个参考列表中的每个参考图片的运动场以4×4块级遍历。对于每个4×4块,如果与块相关联的运动通过当前图片中的4×4块(如图28所示)并且块未被分配任何插值运动,则参考块的运动根据时间距离TD0和TD1(以与HEVC中的TMVP的MV缩放的方式相同的方式)被缩放到当前图片,并且将缩放的运动分配给当前帧中的块。如果没有缩放的MV被分配给4×4块,则在插值运动场中将块的运动标记为不可用。
2.2.11.4.插值和匹配成本
当运动矢量指向分数样本位置时,需要运动补偿插值。为了降低复杂度,替代常规8抽头HEVC插值,将双线性插值用于双边匹配和模板匹配。
匹配成本的计算在不同步骤处有点不同。当从CU级别的候选集中选择候选时,匹配成本是双边匹配或模板匹配的绝对和差(Absolute Sum Difference,SAD)。在确定起始MV之后,子CU级别搜索的双边匹配的匹配成本计算如下:
Figure GDA0003166038010000271
其中w是根据经验设置为4的加权因子,MV和MVs分别指示当前MV和起始MV。SAD仍用作子CU级别搜索的模板匹配的匹配成本。
在FRUC模式中,仅通过使用亮度样本来推导MV。推导的运动将用于MC帧间预测的亮度和色度两者。在确定MV之后,使用用于亮度的8抽头插值滤波器和用于色度的4抽头插值滤波器来执行最终MC。
2.2.11.5.MV细化
MV细化是基于模式的MV搜索,以双边匹配成本或模板匹配成本为标准。在JEM中,支持两种搜索模式—无限制中心偏置菱形搜索(Unrestricted Center-Biased DiamondSearch,UCBDS)和自适应交叉搜索,分别在CU级别和子CU级别进行MV细化。对于CU和子CU级别MV细化两者,以四分之一亮度样本MV精度直接搜索MV,并且接着是八分之一亮度样本MV细化。将用于CU和子CU步骤的MV细化的搜索范围设置为等于8个亮度样本。
2.2.11.6.模板匹配FRUC Merge模式中预测方向的选择
在双边匹配Merge模式中,始终应用双向预测,因为CU的运动信息是基于在两个不同的参考图片中沿当前CU的运动轨迹的两个块之间的最近匹配推导的。对于模板匹配Merge模式没有这样的限制。在模板匹配Merge模式中,编码器可以从列表0中的单向预测、列表1中的单向预测或双向预测当中为CU选择。选择基于如下的模板匹配成本:
如果costBi<=factor*min(cost0,cost1)
则使用双向预测;
否则,如果cost0<=cost1
则使用列表0中的单向预测;
否则,
使用列表1中的单向预测;
其中cost0是列表0模板匹配的SAD,cost1是列表1模板匹配的SAD,costBi是双向预测模板匹配的SAD。factor的值等于1.25,这意味着选择过程偏向于双向预测。
帧间预测方向选择仅应用于CU级别模板匹配过程。
2.2.12.广义双向预测
在传统的双向预测中,来自L0和L1的预测值被平均,以使用相等的权重0.5生成最终预测值。预测值生成公式如等式(32)所示。
PTraditionalBiPred=(PL0+PL1+RoundingOffset)>>shiftNum 等式(32)
在等式(32)中,传统双向预测的最终预测值是PTraditionalBiPred,PL0和PL1分别是来自L0和L1的预测值,并且RoundingOffset和shiftNum被用于归一化最终预测值。
提出广义双向预测(Generalized Bi-prediction,GBI)以允许对来自L0和L1的预测值施加不同的权重。GBI也称为“具有CU权重的双向预测(BCW)”。预测值的生成如等式(32)所示。
PGBi=((1-w1)*PL0+w1*PL1+RoundingOffsetGBi)>>shiftNumGBi 等式(33)
在等式(33)中,PGBi是GBi的最终预测值,(1-w1)和w1是分别施加于L0和L1的预测值的所选择的GBI权重。RoundingOffsetGBi和shiftNumGBi被用于归一化GBi中的最终预测值。
w1的支持的权重为{-1/4,3/8,1/2,5/8,5/4}。支持一个相等权重集和四个不相等权重集。对于相等权重情况,生成最终预测值的过程与传统双向预测模式中的过程完全相同。对于随机接入(random access,RA)条件下的真正双向预测情况,候选权重集的数量减少到三个。
对于高级运动矢量预测(AMVP)模式,如果该CU被双向预测编解码,则GBI中的权重选择在CU级别显式地信令通知。对于Merge模式,权重选择从Merge候选继承。在该提出方案中,GBI支持DMVR生成模板的加权平均以及BMS-1.0的最终预测值。
2.2.13.多假设帧间预测
在多假设帧间预测模式中,除了传统的单/双向预测信号之外,还信令通知一个或多个附加预测信号。产生的整体预测信号通过按样点加权叠加获得。通过单/双向预测信号puni/bi和第一附加帧间预测信号/假设h3,产生的预测信号p3如下获得:
p3=(1-α)puni/bi+αh3 等式(34)
预测单元语法结构的改变在下表中以粗体显示:
表2
Figure GDA0003166038010000291
加权因子α由语法元素add_hyp_weight_idx根据以下映射来指定:
表3
add_hyp_weight_idx α
0 1/4
1 -1/8
注意,对于附加预测信号,预测列表0/列表1的概念被废除,转而使用一个组合列表。该组合列表通过以增加的参考索引交替插入来自列表0和列表1的参考帧、省略已经插入的参考帧而生成,从而避免了双重条目。
类似于上面,可以使用一个以上附加预测信号。产生的整体预测信号与每个附加预测信号迭代累积。
pn+1=(1-αn+1)pnn+1hn+1 等式(35)
获得产生的整体预测信号作为最后一个pn(即pn具有最大索引n)。
注意,同样对于使用MERGE模式(而不是跳过模式)的帧间预测块,可以指定附加帧间预测信号。另外还注意,在MERGE的情况下,不仅单/双向预测参数,还有所选择的Merge候选的附加预测参数都可以被用于当前块。
2.2.14.AMVP模式的单向预测的多假设预测
当多假设预测被应用于改进AMVP模式的单向预测时,信令通知一个标志来启用或禁用对于inter_dir等于1或2的多假设预测,其中1、2和3分别表示列表0、列表1和双向预测。此外,当标志为真时,信令通知一个Merge索引。这样,多假设预测将单向预测变为双向预测,其中一个运动是使用AMVP模式下的原始语法元素获取的,而另一个运动是使用Merge方案获取的。最终预测使用1:1权重将这两个预测组合为双向预测。首先从Merge模式推导Merge候选列表,不包括子CU候选(例如,仿射、可选时域运动矢量预测(ATMVP))。接下来,它被分离成两个单独的列表,一个用于包含来自候选的所有L0运动的列表0(L0),并且另一个用于包含所有L1运动的列表1(L1)。在移除冗余和填充空缺之后,分别为L0和L1生成两个Merge列表。在应用多假设预测来改进AMVP模式时,有两个约束条件。第一,对于亮度编解码块(CB)面积大于或等于64的那些CU,启用该多假设预测。第二,该多假设预测仅适用于在低延迟B图片中时的L1。
2.2.15.跳过/Merge模式的多假设预测
当多假设预测被应用于跳过或Merge模式时,是否启用多假设预测被显式地信令通知。除了原始预测之外,还会选择额外的Merge索引预测。因此,多假设预测的每个候选隐含Merge候选对,其中一个Merge候选用于第一Merge索引预测,而另一个Merge候选用于第二Merge索引预测。然而,在每个对中,第二Merge索引预测的Merge候选被隐式地推导为后续的Merge候选(即已经信令通知的Merge索引加1),而不信令通知任何附加Merge索引。在通过排除那些包含相似Merge候选和填充空缺的对来移除冗余之后,形成用于多假设预测的候选列表。然后,获取来自两个Merge候选的对的运动以生成最终预测,其中5:3权重分别施加于第一Merge索引预测和第二Merge索引预测。此外,启用多假设预测的Merge或跳过CU可以保存除了现有假设的运动信息之外的附加假设的运动信息,以供后面的邻近CU参考。注意,从候选列表中排除子CU候选(例如,仿射、ATMVP),并且对于低延迟的B图片,多假设预测不适用于跳过模式。此外,当多假设预测被应用于Merge或跳过模式时,对于那些CU宽度或CU高度小于16的CU,或者那些CU宽度和CU高度都等于16的CU,双线性插值滤波器被用于多假设的运动补偿。因此,表1中计算了启用多假设预测的每个Merge或跳过CU的最坏情况带宽(每一样点所需的访问样点),并且每个数字小于禁用多假设预测的每个4×4CU的最坏情况带宽的一半。
2.2.16.最终运动矢量表达
提出了最终运动矢量表达(UMVE),也称为具有运动矢量差(MVD)的Merge模式。UMVE利用提出的运动矢量表达方法而被用于跳过或Merge模式。UMVE也称为“运动矢量差Merge(Merge with Motion Vector Differences,MMVD)”。
UMVE重用与VVC中相同的Merge候选。在Merge候选当中,可以选择候选,并通过所提出的运动矢量表达方法进一步扩展。
UMVE提供了具有简化信令的新的运动矢量表达。表达式方法包括起点、运动幅度和运动方向。
图29示出了UMVE搜索过程的示例。
图30示出了UMVE搜索点的示例。
所提出的技术按原样使用Merge候选列表。但是对于UMVE的扩展,仅考虑默认Merge类型(MRG_TYPE_DEFAULT_N)的候选。
基本候选索引定义了起点。基本候选索引指示列表中的候选当中的最佳候选,如下所示。
表4:基本候选IDX
基本候选IDX 0 1 2 3
第N个MVP 第一MVP 第二MVP 第三MVP 第四MVP
如果基本候选的数量等于1,则不信令通知基本候选IDX。
距离索引是运动幅度信息。距离索引指示距起点信息的预定义距离。预定义距离如下:
表5:距离IDX
Figure GDA0003166038010000321
方向索引表示MVD相对于起点的方向。方向索引可以表示如下所示的四个方向。
表6:方向IDX
方向IDX 00 01 10 11
x轴 + N/A N/A
y轴 N/A N/A +
UMVE标志在发送跳过标志和Merge标志之后立即被信令通知。如果跳过和Merge标志为真,则解析UMVE标志。如果UMVE标志等于1,则解析UMVE语法。但是,如果不是1,则解析AFFINE标志。如果AFFINE标志等于1,这就是AFFINE模式,但是,如果不是1,则解析跳过/Merge索引以用于VTM的跳过/Merge模式。
不需要由于UMVE候选的附加行缓冲。因为软件的跳过/Merge候选直接用作基本候选。使用输入的UMVE索引,在运动补偿之前就决定MV的补充。不需要为此保留长行缓冲区。
2.2.17.具有预测偏移的仿射Merge模式
UMVE被扩展到仿射Merge模式,此后将被称为UMVE仿射模式。所提出的方法选择第一可用仿射Merge候选作为基本预测值。然后,它将运动矢量偏移应用于来自基本预测值的每个控制点的运动矢量值。如果没有可用的仿射Merge候选,则不使用该提出的方法。
所选择的基本预测值的帧间预测方向和每个方向的参考索引被不加改变地使用。
在当前实施方式中,当前块的仿射模型被假定为4参数模型,只需要推导2个控制点。因此,仅基本预测值的前2个控制点将被用作控制点预测值。
对于每个控制点,zero_MVD标志被用于指示当前块的控制点是否具有与对应控制点预测值相同的MV值。如果zero_MVD标志为真,则控制点不需要其他信令。否则,对控制点信令通知距离索引和偏移方向索引。
使用尺寸为5的距离偏移表,如下表所示。信令通知距离索引,以指示使用哪个距离偏移。距离索引和距离偏移值的映射如图30所示。
表7:距离偏移表
距离DX 0 1 2 3 4
距离偏移 1/2像素 1像素 2像素 4像素 8像素
图31示出了距离索引和距离偏移映射的示例。
方向索引可以表示如下所示的四个方向,其中只有x或y方向可能有MV差,但不是两个方向都有。
表8:偏移方向表
偏移方向IDX 00 01 10 11
x-dir-factor +1 –1 0 0
y-dir-factor 0 0 +1 –1
如果帧间预测是单向的,则信令通知的距离偏移被应用于每个控制点预测值的偏移方向。结果将是每个控制点的MV值。
例如,当基本预测值是单向的时,并且控制点的运动矢量值是MVP(vpx,vpy)。当信令通知距离偏移和方向索引时,当前块的对应控制点的运动矢量将计算如下。
MV(vx,vy)=MVP(vpx,vpy)+MV(x-dir-factor*distance-offset,y-dir-factor*
distance-offset) 等式(36)
如果帧间预测是双向的,则信令通知的距离偏移被应用在控制点预测值的L0运动矢量的所信令通知的偏移方向上;并且具有相反方向的相同距离偏移被应用于控制点预测值的L1运动矢量。结果将是每个控制点在每个帧间预测方向上的MV值。
例如,当基本预测值是单向的时,并且L0上的控制点的运动矢量值是MVPL0(v0px,v0py),并且L1上的该控制点的运动矢量是MVPL1(v1px,v1py)。当信令通知距离偏移和方向索引时,当前块的对应控制点的运动矢量将计算如下。
MVL0(v0x,v0y)=MVPL0(v0px,v0py)+MV(x-dir-factor*distance-offset,y-dir-factor*distance-offset) 等式(37)
MVL1(v0x,v0y)=MVPL1(v0px,v0py)+MV(-x-dir-factor*distance-offset,-y-dir-
factor*distance-offset) 等式(38)
2.2.18.双向光流
双向光流(BIO)是按样点的运动细化,其在用于双向预测的按块的运动补偿的基础上进行。样点级别运动细化不使用信令。
假设I(k)是块运动补偿之后来自参考k(k=0,1)的亮度值,并且
Figure GDA0003166038010000341
Figure GDA0003166038010000342
分别是I(k)梯度的水平分量和垂直分量。假设光流是有效的,运动矢量场(vx,vy)由等式给出:
Figure GDA0003166038010000343
将该光流等式与Hermite插值相结合以获得每个样点的运动轨迹,最终得到与函数值I(k)和导数
Figure GDA0003166038010000344
相匹配的唯一的三阶多项式。t=0时该多项式的值是BIO预测:
Figure GDA0003166038010000345
这里,τ0和τ1表示到参考帧的距离,如图31所示。距离τ0和τ1是基于Ref0和Ref1的POC计算的:τ0=POC(当前)-POC(Ref0),τ1=POC(Refl)-POC(当前)。如果两个预测来自相同的时间方向(要么都来自过去,要么都来自未来),则信号是不同的(即τ0·τ1<0)。在这种情况下,只有当预测不是来自相同时刻(即τ0≠τ1)、两个参考区域都具有非零运动(MVx0,MVy0,MVx1,MVy1≠0)、并且块运动矢量与时间距离成比例(MVx0/MVx1=MVy0/MVy1=-τ01)时,才应用BIO。
通过最小化点A和点B(图32上运动轨迹和参考帧平面的交点)的值之间的差Δ来确定运动矢量场(vx,vy)。模型只使用对于Δ的局部Taylor展开的第一线性项:
Figure GDA0003166038010000346
等式41中的所有值都取决于样点位置(i′,j′),到目前为止从符号中忽略该位置。假设运动在局部周围区域中是一致的,我们最小化以当前预测点(i,j)为中心的(2M+1)×(2M+1)正方形窗口Ω内的Δ,其中M等于2:
Figure GDA0003166038010000351
对于这个优化问题,JEM使用简化的方法,首先在垂直方向最小化,然后在水平方向最小化。这得到:
Figure GDA0003166038010000352
Figure GDA0003166038010000353
其中,
Figure GDA0003166038010000354
为了避免除以零或非常小的值,正则化参数r和m被引入等式43和44中。
r=500·4d-8 等式(46)
m=700·4d-8 等式(47)
这里d是视频样点的比特深度。
为了保持BIO的存储器访问与规则双向预测运动补偿的相同,所有预测和梯度值I(k)
Figure GDA0003166038010000355
都仅针对当前块内部的位置进行计算。在等式30中,以预测块的边界上的当前预测点为中心的(2M+1)×(2M+1)正方形窗口Ω需要访问块的外部的位置(如图33A所示)。在JEM中,块外部的I(k),
Figure GDA0003166038010000357
的值被设置为等于块内部最近的可用值。例如,这可以实施为填充,如图33B所示。
利用BIO,有可能针对每个样点细化运动场。为了降低计算复杂度,在JEM中使用基于块的BIO设计。基于4×4块来计算运动细化。在基于块的BIO中,聚合4×4块中所有样点的等式30中的sn值,然后sn的聚合值用于推导4×4块的BIO运动矢量偏移。更具体地,以下公式用于基于块的BIO推导:
Figure GDA0003166038010000358
其中bk表示属于预测块的第k个4×4块的样点集。等式43和44中的sn被((sn,bk)>>4)代替,以推导相关联的运动矢量偏移。
在某些情况下,由于噪音或不规则的运动,BIO的MV细化可能不可靠。因此,在BIO中,MV细化的幅度被限幅到阈值thBIO。阈值基于当前图片的参考图片是否都来自一个方向来确定。如果当前图片的所有参考图片都来自一个方向,则阈值被设置为12×214-d;否则,它被设置为12×213-d
使用与HEVC运动补偿过程(2D可分离FIR)一致的操作,与运动补偿插值同时计算BIO的梯度。该2D可分离FIR的输入是与运动补偿过程和根据块运动矢量的分数部分的分数位置(fracX,fracY)相同的参考帧样点。在水平梯度
Figure GDA0003166038010000361
的情况下,首先使用与具有去缩放(de-scaling)偏移d-8的分数位置fracY相对应的BIOfilterS对信号垂直插值,然后在水平方向上应用与具有去缩放偏移18-d的分数位置fracX相对应的梯度滤波器BIOfilterG。在垂直梯度
Figure GDA0003166038010000362
的情况下,首先使用与具有去缩放偏移d-8的分数位置fracY相对应的BIOfilterG来垂直地应用梯度滤波器,然后在水平方向上使用与具有去缩放偏移18-d的分数位置fracX相对应的BIOfilterS来执行信号位移。用于梯度计算的插值滤波器BIOfilterG和信号位移BIOfilterF的长度较短(6抽头),以便维持合理的复杂性。表9示出了用于BIO中块运动矢量的不同分数位置的梯度计算的滤波器。表10示出了用于BIO中预测信号生成的插值滤波器。
表9:用于BIO中梯度计算的滤波器
分数像素位置 梯度的插值滤波器(BIOfilterG)
0 {8,-39,-3,46,-17,5}
1/16 {8,-32,-13,50,-18,5}
1/8 {7,-27,-20,54,-19,5}
3/16 {6,-21,-29,57,-18,5}
1/4 {4,-17,-36,60,-15,4}
5/16 {3,-9,-44,61,-15,4}
3/8 {1,-4,-48,61,-13,3}
7/16 {0,1,-54,60,-9,2}
1/2 {-1,4,-57,57,-4,1}
表10:用于BIO中预测信号生成的插值滤波器
分数像素位置 预测信号的插值滤波器(BIOfilterS)
0 {0,0,64,0,0,0}
1/16 {1,-3,64,4,-2,0}
1/8 {1,-6,62,9,-3,1}
3/16 {2,-8,60,14,-5,1}
1/4 {2,-9,57,19,-7,2}
5/16 {3,-10,53,24,-8,2}
3/8 {3,-11,50,29,-9,2}
7/16 {3,-11,44,35,-10,3}
1/2 {3,-10,35,44,-11,3}
在JEM中,当两个预测来自不同的参考图片时,BIO被应用于所有双向预测块。当对于CU启用LIC时,BIO被禁用。
在JEM中,OBMC被应用于正常MC过程之后的块。为了降低计算复杂性,BIO没有在OBMC过程期间被应用。这意味着当使用自己的MV时,BIO仅应用于块的MC过程,而当在OBMC过程期间使用邻近块的MV时,BIO不应用于MC过程。
2.2.19.解码器侧运动矢量细化
在双向预测操作中,对于一个块区域的预测,分别使用列表0的运动矢量(MV)和列表1的MV形成的两个预测块被组合以形成单个预测信号。在解码器侧运动矢量细化(DMVR)方法中,双向预测的两个运动矢量通过双边模板匹配过程进一步细化。双边模板匹配应用于解码器中,以在双边模板和参考图片中的重构样点之间执行基于失真的搜索,以便在不发送附加运动信息的情况下获得细化的MV。
在DMVR中,从列表0的初始MV0和列表1的MV1分别生成双边模板作为两个预测块的加权组合(即平均值),如图34所示。模板匹配操作包括计算生成的模板和参考图片中的(初始预测块周围的)样点区域之间的成本度量。对于两个参考图片中的每一个,产生最小模板成本的MV被认为是该列表中用以替换原始MV的更新后的MV。在JEM中,对于每个列表搜索9个MV候选。9个候选MV包括原始MV和8个周围MV,其中一个亮度样点在水平或垂直方向或两者上相对于原始MV偏移的亮度样点。最后,两个新的MV(即如图33所示的MV0′和MV1′)用于生成最终的双向预测结果。绝对差之和(sum of absolute differences,SAD)被用作成本度量。请注意,当计算由一个周围MV生成的预测块的成本时,取整的MV(取整到整数像素)实际上用于获得预测块,而不是实际的MV。
DMVR应用于双向预测的Merge模式,其中一个MV来自过去的参考图片,并且另一个来自未来的参考图片,而无需传输附加语法元素。在JEM中,当对于CU启用LIC、仿射运动、FRUC或子CUMerge候选时,不应用DMVR。
3.相关工具
3.1.1.扩散滤波器
在JVET-L0157中,提出了扩散滤波器,其中CU的帧内/帧间预测信号可以通过扩散滤波器来进一步修改。
3.1.1.1均匀扩散滤波器
均匀扩散滤波器是通过将预测信号与给定为hI或hIV的固定掩模(定义如下)进行卷积来实现的。
除了预测信号本身,块的左边和上边的一行重构样点被用作滤波器信号的输入,其中可以避免在帧间块使用这些重构样点。
令pred为通过帧内或运动补偿预测获得的给定块上的预测信号。为了处理滤波器的边界点,预测信号需要扩展到预测信号predext。这种扩展预测可以以两种方式形成:或者,作为中间步骤,将块的左边和上边的一行重构样点添加到预测信号中,然后在所有方向上镜像所产生的信号。或者仅预测信号本身在所有方向上被镜像。后一个扩展被用于帧间块。在这种情况下,仅预测信号本身包括扩展预测信号predext的输入。
如果要使用滤波器hI,则提出用hI*pred替换预测信号pred。
使用前述边界扩展。这里,滤波器掩模hI给出如下:
Figure GDA0003166038010000381
如果要使用滤波器hIV,则提出用hIV*pred替换预测信号pred。
hIV*pred 等式(50)
这里,滤波器hIV给出如下:
hIV=hI*hI*hI*hI. 等式(51)
3.1.1.2.方向扩散滤波器
代替使用信号自适应扩散滤波器,而使用方向滤波器、水平滤波器hhor和垂直滤波器hver,其仍然具有固定的掩模。更准确地,前一章节的对应于掩模hI的均匀扩散滤波被简单地限制为仅沿垂直方向或沿水平方向应用。垂直滤波器通过将固定的滤波器掩模
Figure GDA0003166038010000391
应用于预测信号来实现,并且水平滤波器通过使用转置掩模
Figure GDA0003166038010000392
来实现。
3.1.2.双边滤波器
在JVET-L0406中提出了双边滤波器,并且它总是应用于具有非零变换系数且条带量化参数大于17的亮度块。因此,不需要信令通知双边滤波器的使用。双边滤波器,如果被应用,则在逆变换后立即对解码样点执行双边滤波器。另外,滤波器参数(即权重)是从编解码信息中显式地推导的。
滤波过程定义为:
Figure GDA0003166038010000393
其中P0,0是当前样点的强度并且P′0,0是当前样点的修改后的强度,Pk,0和Wk分别是第k个邻近样点的强度和权重参数。图35中描绘了一个当前样点及其四个邻近样点(即K=4)的示例。
更具体地,与第k个邻近样点相关联的权重Wk(x)定义如下:
Wk(x)=Distancek×Rangek(x) 等式(55)
其中
Figure GDA0003166038010000394
Figure GDA0003166038010000395
并且σd取决于编解码模式和编解码块尺寸。所描述的滤波过程被应用于帧内编解码块,并且当TU被进一步划分时所描述的滤波过程被应用于帧间编解码块,以启用并行处理。
为了更好地捕获视频信号的统计特性,并提高滤波器的性能,由等式(55)产生的权重函数正由表11中列出的参数σd调整,该参数σd取决于编解码模式和块分割参数(最小尺寸)。
表11:对于不同的块尺寸和编解码模式的σd的值
Min(块宽度,块高度) 帧内模式 帧间模式
4 82 62
8 72 52
其它 52 32
为了进一步提高编解码性能,对于未划分TU时的帧间编解码块,当前样点与其邻近样点之一之间的强度差被覆盖当前样点和邻近样点的两个窗口之间的代表性强度差所替换。因此,滤波过程等式被修改为:
Figure GDA0003166038010000401
其中Pk,m和P0,m表示分别以Pk,0和P0,0为中心的窗口内的第m个样点值。在该提出方案中,窗口尺寸被设置为3×3。图36中描绘了覆盖P2,0和P0,0的两个窗口的示例。
3.1.3.帧内块复制
解码器方面:
在一些方面,当前(部分)解码的图片被认为是参考图片。当前图片放在参考图片列表0的最后位置。因此,对于使用当前图片作为唯一参考图片的条带,其条带类型被认为是P条带。这种方法中的比特流语法遵循用于帧间编解码的相同语法结构,而解码过程与帧间编解码是统一的。唯一突出的区别是块矢量(其是指向当前图片的运动矢量)总是使用整数像素分辨率。
与块级别CPR_flag方法的变化是:
·在编码器中搜索此模式时,块宽度和高度都小于或等于16。
·当亮度块矢量为奇数时,启用色度插值。
·当SPS标志开启时,启用CPR模式的自适应运动矢量分辨率(AMVP)。在这种情况下,当使用AMVR时,块矢量可以在块级别在1像素整数分辨率和4像素整数分辨率之间切换。
编码器方面:
编码器对宽度或高度不大于16的块执行RD检查。对于非Merge模式,首先使用基于哈希的搜索来执行块矢量搜索。如果哈希搜索中没有找到有效的候选,则将执行基于块匹配的本地搜索。
在基于哈希的搜索中,当前块和参考块之间的哈希键匹配(32位CRC)被扩展到所有允许的块尺寸。当前图片中每个位置的哈希键计算基于4×4块。对于较大尺寸的当前块,当它的所有4×4块与对应参考位置中的哈希键匹配时,出现与参考块匹配的哈希键。如果发现多个参考块与具有相同哈希键的当前块匹配,则计算每个候选的块矢量成本,并选择成本最小的一个。
在块匹配搜索中,搜索范围被设置为当前块左边和顶部的64个像素。
3.1.4.基于历史的运动矢量预测
于2018年7月2日提交的标题为“MOTION VECTOR PREDICTION BASED ON LOOK-UPTABLES(基于查找表的运动矢量预测)”的国际专利申请PCT/CN2018/093987描述了一个或多个查找表,其内容通过引用并入本文。至少一个运动候选被存储以预测块的运动信息。
提出了一种基于历史的MVP(HMVP)方法,其中HMVP候选被定义为先前编解码块的运动信息。在编码/解码过程期间,维护具有多个HMVP候选的表。当遇到新的条带时,表被清空。每当有帧间编解码块时,相关联的运动信息被添加到表的最后一个条目中作为新的HMVP候选。整个编解码流程如图37所示。在一个示例中,表尺寸被设置为L(例如,L=16或6,或44),这表明可以向表中添加多达L个HMVP候选。
1)在一个实施例中,如果从先前编解码块中有L个以上HMVP候选,则应用先进先出(First-In-First-Out,FIFO)规则,使得该表总是包含最新的先前编解码的L个运动候选。图38描绘了应用FIFO规则来移除HMVP候选,并且向所提出的方法中使用的表添加新的候选的示例。
2)在另一实施例中,每当添加新的运动候选(诸如当前块是帧间编解码和非仿射模式)时,首先应用冗余校验过程来识别LUT中是否存在相同或相似的运动候选。
3.2.JVET-M0101
3.2.1.添加HEVC式加权预测
下表示出了语法元素的示例。为了实施HEVC式的加权预测,可以对PPS和条带头进行如下以粗体显示的语法改变:
表12:语法元素的示例
Figure GDA0003166038010000421
Figure GDA0003166038010000422
Figure GDA0003166038010000431
Figure GDA0003166038010000441
Figure GDA0003166038010000451
3.2.2.以互斥方式调用(利用加权平均的双向预测双向预测(bi-predictionwith weighted averaging,BWA),又名GBI)和WP
尽管BWA和WP都将权重施加于运动补偿预测信号,但是具体操作是不同的。在双向预测情况下,取决于与用于生成预测信号的ref_idx相关联的(权重、偏移)参数,WP将线性权重和恒定偏移施加于每个预测信号。尽管对这些(权重、偏移)值有一些范围限制,但允许的范围相对较大,并且对参数值没有归一化限制。WP参数在图片级别(在条带头中)信令通知。已经显示出WP为衰落序列提供了非常大的编解码增益,并且通常期望对于这种内容启用WP。
BWA使用CU级别索引来指示在双向预测的情况下如何组合两个预测信号。BWA采用加权平均,即两个权重加起来等于1。BWA为CTC RA配置提供了约0.66%的编解码增益,但对于衰落内容,其效果远不如WP(JVET-L0201)。
方法#1
检查PPS语法元素weight_bipred_flag,以确定gbi_idx是否在当前CU处信令通知。语法信令以粗体修改如下:
表13:语法元素的示例
Figure GDA0003166038010000461
如果当前条带参考weight_bipred_flag设置为1的PPS,则第一种选择将禁用当前条带的所有参考图片的BWA。
方法#2
仅当双向预测中使用的两个参考图片都已开启加权预测,即这些参考图片的(权重、偏移)参数具有非默认值时,BWA才被禁用。这允许使用具有默认WP参数的参考图片的双向预测CU(即WP不被调用用于这些CU)仍然能够使用BWA。语法信令以粗体修改如下:
表14:语法元素示例
Figure GDA0003166038010000462
Figure GDA0003166038010000471
4.问题
在LIC中,包括缩放参数a和偏移b的两个参数需要通过使用邻近重构像素而推导,这可能导致时延问题。
混合帧内和帧间预测、扩散滤波器、双边滤波器、OBMC和LIC需要以不同的方式进一步修改帧间预测信号,它们都有时延问题。
5.一些示例实施例和技术
1.提供下面的示例来解释一般概念。这些示例不应该狭隘地解释。此外,下面的示例可以以任何方式而组合。提出了仅可以对位于CTU边界处的块(称为边界块)执行LIC,并且当前CTU外的邻近重构样点可以用于推导LIC参数。在这种情况下,对于不位于CTU边界的那些块(称为内部块),LIC总是被禁用而不被信令通知。
a.当前CTU外部的邻近重构样点的选择可以取决于块相对于覆盖当前块的CTU的位置。
b.在一个示例中,对于CTU的左边界处的块,可以仅使用CU的左边的重构邻近样点来推导LIC参数。
c.在一个示例中,对于CTU的顶部边界处的块,可以仅使用CU的上边的重构邻近样点来推导LIC参数。
d.在一个示例中,对于CTU的左上角处的块,可以使用块的左边和/或上边的重构邻近样点来推导LIC参数。
e.在一个示例中,对于CTU的右上角处的块,使用块的右上和/或上边的重构邻近样点来推导LIC参数。
f.在一个示例中,对于CTU的左下角处的块,使用块的左下和/或左边的重构邻近样点来推导LIC参数。
2.提出了可以仅为位于CTU边界处的块推导LIC参数集,并且CTU的内部块可以从这些LIC参数集的一个或多个集继承。
a.在一个示例中,为每个CTU维护一个LIC参数查找表,并且将每个推导出的LIC参数的集合插入到LIC参数表中。P1805028401H中描述的方法可以用来维护LIC参数查找表。
b.可替代地,为每个参考图片维护这样的查找表,并且当推导LIC参数时,为所有参考图片推导LIC参数。
c.在一个示例中,这样的查找表在每个CTU或CTU行或条带或片或片组或图片的开头被清空。
d.在一个示例中,对于以AMVP模式或仿射帧间模式编解码的内部块,如果LIC标志为真,则所使用的LIC参数集合被显式地信令通知。例如,索引被信令通知,以指示查找表的哪个条目用于每个参考图片。
i.在一个示例中,对于单向预测块,如果对于参考图片在查找表中没有有效条目,则LIC标志将为假。
ii.在一个示例中,对于双向预测块,如果对于任何参考图片在查找表中没有有效条目,则LIC标志将为假。
iii.在一个示例中,对于双向预测块,如果对于参考图片中的至少一个在查找表中存在有效条目,则LIC标志可以为真。对于具有有效LIC参数的每个参考图片,信令通知一个LIC参数索引。
e.在一个示例中,维护一个以上查找表。
i.在一个示例中,当编码/解码当前CTU时,它仅使用来自通过一些先前编码/解码的CTU生成的查找表的参数,并且通过当前CTU生成的查找表用于一些后面的CTU。
ii.在一个示例中,每个查找表可以对应于一个参考图片/一个参考图片列表/特定范围的块尺寸/特定编解码模式/特定块形状等。
f.在一个示例中,如果内部块是以Merge或仿射Merge模式而编解码的,则对于空域或/和时域Merge候选,从对应的邻近块继承LIC标志和LIC参数两者。
i.可替代地,LIC标志被继承,并且LIC参数可以被显式地信令通知。
ii.可替代地,LIC标志被显式地信令通知,并且LIC参数可以被继承。
iii.可替代地,LIC标志和LIC参数都被显式地信令通知。
iv.可替代地,块的LIP参数和继承的参数之间的差被信令通知。g.在一个示例中,对于以AMVP模式或仿射帧间模式编解码的边界块,如果LIC标志为真,则使用与2.2.7中相同的方法隐式地推导所使用的LIC参数。
h.在一个示例中,如果边界块是以Merge或仿射Merge模式而编解码的,则对于空域或/和时域Merge候选,从对应的邻近块继承LIC标志和LIC参数两者。
i.可替代地,LIC标志被继承,并且LIC参数可以被显式地信令通知。
ii.可替代地,LIC标志被显式地信令通知,并且LIC参数可以被继承。
iii.可替代地,LIC标志和LIC参数都被显式地信令通知。
i.在一个示例中,如果块是以Merge模式而编解码的,则对于组合的Merge候选或平均Merge候选,LIC总是被禁用。
i.可替代地,如果用于生成组合的Merge候选或平均Merge候选的两个Merge候选中的任何一个的LIC标志为真,则LIC标志被设置为真。
ii.对于内部块,如果用于生成组合的Merge候选或平均Merge候选的两个Merge候选都使用LIC,则它可以从其中任何一个继承LIC参数。
iii.可替代地,LIC标志被继承,并且LIC参数可以被显式地信令通知。
iv.可替代地,LIC标志被显式地信令通知,并且LIC参数可以被继承。
v.可替代地,LIC标志和LIC参数都被显式地信令通知。j.在一个示例中,如果块是以来自HMVP Merge候选的Merge模式而编解码的,则LIC总是被禁用。
i.可替代地,如果块是用来自HMVP Merge候选的Merge模式编解码的,则LIC总是被启用。
ii.可替代地,如果HMVP Merge候选的LIC标志为真,则LIC标志被设置为真。
1.LIC标志被显式地信令通知。
iii.可替代地,如果HMVP Merge候选的LIC标志为真,则LIC标志被设置为真,并且从HMVP Merge候选继承LIP参数。
1.可替代地,LIC参数被显式地信令通知。
2.可替代地,隐式地推导LIC参数。
3.提出了LIC可以与帧内复制块(IBC,或当前图片参考)模式一起使用。
a.例如,如果块以帧内块复制模式而编解码,则可以进一步信令通知LIC使用的指示(例如,LIC标志)。
b.在一个示例中,在Merge模式下,如果IBC编解码的块从邻近块继承运动信息,则它也可以继承LIC标志。
1.可替代地,它也可以继承LIC参数。
c.如果LIC标志为真,则使用与2.2.7中相同的方法隐式地推导LIC参数。
d.在一个示例中,可以使用以上实施例中描述的方法。
e.可替代地,如果用启用的LIC对块进行编解码,则可以进一步信令通知IBC使用的指示。
4.提出了与GBI或多假设帧间预测相排斥地使用LIC。在一些实施方式中,GBI或多假设帧间预测被禁用而LIC被启用。在一些实施方式中,LIC或多假设帧间预测被禁用而GBI被启用。在一些实施方式中,LIC或GBI被禁用而多假设帧间预测被启用。
a.在一个示例中,可以在LIC信息之后信令通知GBI信息。
i.在一个示例中,是否信令通知GBI信息可以取决于信令通知/推断的LIC信息。
ii.可替代地,此外,是否信令通知GBI信息可以取决于与当前块或包含当前块的当前片/片组/图片的至少一个参考图片相关联的LIC信息和加权预测信息。
iii.该信息可以在SPS/PPS/条带头/片组头/片/CTU/CU中被信令通知。
b.可替代地,可以在GBI信息之后信令通知LIC信息。
i.在一个示例中,是否信令通知LIC信息可以取决于信令通知/推断的GBI信息。
ii.此外,可替代地,是否信令通知LIC信息可以取决于与当前块或包含当前块的当前片/片组/图片的至少一个参考图片相关联的GBI信息和加权预测信息。
iii.该信息可以在SPS/PPS/条带头/片组头/片/CTU/CU中被信令通知。
c.在一个示例中,如果LIC标志为真,则GBI或多假设帧间预测所需的语法元素不被信令通知。
d.在一个示例中,如果GBI标志为真(例如,将不相等权重施加于两个或多个参考图片),则LIC或多假设帧间预测所需的语法元素不被信令通知。
e.在一个示例中,如果对具有两个或多个参考图片的不相等权重的块启用GBI,则LIC或多假设帧间预测所需的语法元素不被信令通知。
f.在一个示例中,与子块技术(诸如仿射模式)相排斥地使用LIC。在一些实施方式中,LIC与子块技术被互斥地使用。
g.在一个示例中,与三角形预测模式相排斥地使用LIC。在一些实施方式中,LIC与三角形预测模式被互斥地使用。
i.在一示例中,当对一个块启用三角形预测模式时,LIC总是被禁用。
ii.在一个示例中,可以从空域或时域块或其他种类的运动候选(例如,HMVP候选)继承一个TPM Merge候选的LIC标志。
iii.在一个示例中,可以从一些空域或时域块(例如,仅A1、B1)继承一个TPMMerge候选的LIC标志。
iv.可替代地,一个TPM Merge候选的LIC标志可以总是被设置为假。
h.在一个示例中,如果多假设帧间预测被启用,则不信令通知LIC或GBI所需的语法元素。
i.可以按特定顺序检查不同的工具。此外,可替代地,当决定启用以上工具之一时,这样的检查过程终止。
i.在一个示例中,检查顺序是LIC->GBI->多假设帧间预测。
ii.在一个示例中,检查顺序是LIC->多假设帧间预测->GBI。
iii.在一个示例中,检查顺序是GBI->LIC->多假设帧间预测。
iv.在一个示例中,检查顺序是GBI->多假设帧间预测->LIC。
v.顺序可以基于先前编解码的信息和/或基于当前块的编解码信息(例如,块尺寸/参考图片/MV信息/低延迟检查标志/片/图片/条带类型),诸如基于邻近块的模式,而自适应地改变。
j.仅当当前块是单向预测时,才可以应用以上方法。
5.提出了在块级别与加权预测相排斥地使用LIC。在一些实施方式中,由于确定加权预测工具被用于块的至少一个参考图片或用于块的所有参考图片,因此首先确定是否禁用了加权预测工具并且禁用LIC工具。
a.在一个示例中,当当前块是双向预测时,LIC信息的信令通知可以取决于weighted_bipred_flag。
b.在一个示例中,当当前块是单向预测时,LIC信息的信令通知可以取决于weighted_pred_flag。
c.在一个示例中,LIC信息的信令通知可以取决于一个或所有参考图片相关联的加权预测参数,其中该一个或所有参考图片与当前块相关联。
d.在一个示例中,如果对块的一些参考图片或所有参考图片启用加权预测,则可以对该块禁用LIC,并且不信令通知LIC相关的语法元素。
e.在一个示例中,即使对块的一些参考图片或所有参考图片启用加权预测,仍然可以应用LIC,并且可以对该块禁用加权预测。
i.可替代地,可以将LIC应用于未应用加权预测的参考图片,并且可以关于应用加权预测的参考图片禁用LIC。
f.可替代地,可以一起使用LIC与加权预测用于一个块。
6.提出了在图片级别/条带级别/片组级别/CTU组级别与加权预测相排斥地使用LIC。在一些实施方式中,由于确定加权预测工具被用于块的至少一个参考图片或用于块的所有参考图片,因此首先确定是否禁用了加权预测工具并且禁用LIC工具。
a.在一个示例中,如果对图片/条带/片组/CTU组的一些参考图片或所有参考图片启用加权预测,则禁用LIC,并且不信令通知所有相关的语法元素。
b.在一个示例中,如果对图片/条带/片组/CTU组启用LIC,则对其所有参考图片禁用加权预测,并且不信令通知所有相关的语法元素。
c.可替代地,可以一起使用LIC与加权预测。
7.提出了与CPR模式相排斥地使用LIC。在一些实施方式中,LIC和CPR模式被互斥地使用。
a.在一个示例中,当对块启用CPR模式时,可以跳过LIC使用的指示和/或边信息的信令通知。
b.可替代地,当对块启用LIC模式时,可以跳过CPR使用的指示和/或边信息的信令通知。
8.可替代地,提出了LIC可以与多假设预测(如2.2.13、2.2.14、2.2.15中所述)一起使用。
a.在一个示例中,为多假设AMVP和Merge模式(例如,如2.2.14中所述)显式地信令通知LIC标志。
i.在一个示例中,显式地信令通知的LIC标志被应用于AMVP模式和Merge模式。
ii.在一个示例中,显式地信令通知的LIC标志仅被应用于AMVP模式,而用于Merge模式的LIC标志从对应的Merge候选继承。不同的LIC标志可以被用于AMVP模式和Merge模式。
同时,可以为AMVP模式和Merge模式推导/继承不同的LIC参数。
1.可替代地,始终对Merge模式禁用LIC。
iii.可替代地,不信令通知LIC标志,并且始终对AMVP模式禁用LIC。然而,对于Merge模式,可以继承或推导LIC标志或/和LIC参数。
b.在一个示例中,从多假设Merge模式(例如,如2.2.15中所述)的对应Merge候选继承LIC标志。
i.在一个示例中,为两个选择的Merge候选中的每一个继承LIC标志,因此,可以为两个选择的Merge候选继承不同的LIC标志。同时,可以为两个选择的Merge候选推导/继承不同的LIC参数。
ii.在一个示例中,仅为第一选择的Merge候选继承LIC标志,而始终对第二选择的Merge候选禁用LIC。
c.在一个示例中,为多假设帧间预测模式(例如,如2.2.13中所述)显式地信令通知LIC标志。
i.在一个示例中,如果以Merge模式(或UMVE模式)和附加运动信息来预测块,则显式地信令通知的LIC标志可以被应用于Merge模式(或UMVE模式)和附加运动信息。
ii.在一个示例中,如果以Merge模式(或UMVE模式)和附加运动信息来预测块,则显式地信令通知的LIC标志可以被应用于附加运动信息。而对于Merge模式,可以继承或推导LIC标志或/和LIC参数。
1.可替代地,始终对Merge模式禁用LIC。
iii.在一个示例中,如果以Merge模式(或UMVE模式)和附加运动信息来预测块,则不信令通知LIC标志并对附加运动信息禁用LIC标志。而对于Merge模式,可以继承或推导LIC标志或/和LIC参数。
iv.在一个示例中,如果以AMVP模式和附加运动信息来预测块,则显式地信令通知的LIC标志可以应用于AMVP模式和附加运动信息。
1.可替代地,始终对附加的运动信息禁用LIC。
v.可以为Merge模式(或UMVE模式)/AMVP模式和附加运动信息推导/继承不同的LIC参数。
d.当多假设被应用于块时,照明补偿可以被应用于特定预测信号,而不是所有预测信号。
e.当多假设被应用于块时,可以信令通知/推导一个以上的标志以指示对预测信号的照明补偿的使用。
9.提出了可以在UMVE模式下从基本Mrege候选继承LIC标志。
a.在一示例中,如2.2.7中所述隐式地推导LIC参数。
b.在一个示例中,对于在UMVE模式下编解码的边界块,如2.2.7中所述隐式地推导LIC参数。
c.在一个示例中,对于在UMVE模式下编解码的内部块,LIC参数是从基本Mrege候选继承的。
10.以上提出的方法或LIC可以在特定条件(诸如块尺寸、条带/图片/片类型、或运动信息)下应用。
a.在一个示例中,当块尺寸包含小于M*H个样点,例如,16或32或64个亮度样点时,提出的方法或LIC不被允许。
b.可替代地,当块的宽度或/和高度的最小尺寸小于或不大于X时,提出的方法或LIC不被允许。在一个示例中,X被设置为8。
c.可替代地,当块的宽度>th1或>=th1和/或块的高度>th2或>=th2时,提出的方法或LIC不被允许。在一个示例中,th1和/或th2被设置为8。
d.可替代地,当块的宽度<th1或<=th1和/或块的高度<th2或<=th2时,提出的方法或LIC不被允许。在一个示例中,th1和/或th2被设置为8。
e.在一个示例中,对仿射帧间模式或/和仿射Merge模式禁用LIC。
f.在一个示例中,对于子块编解码工具(如ATMVP或/和STMVP或/和平面运动矢量预测模式)禁用LIC。
g.在一个示例中,LIC仅被应用于某些分量。例如,LIC被应用于亮度分量。
i.可替代地,LIC被应用于色度分量。
h.在一个示例中,如果LIC标志为真,则禁用BIO或/和DMVR。
i.在一个示例中,对双向预测块禁用LIC。
j.在一个示例中,对以AMVP模式编解码的内部块禁用LIC。
k.在一个示例中,LIC仅被允许用于单向预测块。
11.提出了对用于推导LIC参数的邻近样点的选择可以取决于编解码信息、块形状等。
a.在一个示例中,如果宽度>=高度或宽度>高度,则仅上边的邻近像素被用于推导LIC参数。
b.在一个示例中,如果宽度<高度,则仅左边的邻近像素被用于推导LIC参数。
12.可以在SPS/PPS/VPS/序列头/图片头/条带头/片组头/CTU组等中信令通知是否启用或禁用以上方法。
a.可替代地,可以在SPS/PPS/VPS/序列头/图片头/条带头/片组头/CTU组等中信令通知使用哪种方法。
b.可替代地,是否启用或禁用以上方法和/或应用哪种方法可以取决于块维度、视频处理数据单元(VPDU)、图片类型、低延迟检查标志、当前块(诸如参考图片、单向预测或双向预测)或先前编解码的块的编解码信息。
6.附加实施例
方法#1
检查PPS语法元素weight_bipred_flag,以确定LIC_enabled_flag是否在当前CU处被信令通知。语法信令以粗体文本修改如下:
表15:语法元素的示例
Figure GDA0003166038010000561
第一种替代将对当前条带/片/片组的所有参考图片禁用LIC,例如,
1.如果当前条带是指weighted_bipred_flag被设置为1并且当前块被双向预测的PPS;
2.如果当前条带是指weighted_pred_flag被设置为1并且当前块被单向预测的PPS;
方法#2
对于双向预测情况:
仅当双向预测中使用的两个参考图片都已开启加权预测,即这些参考图片的(权重、偏移)参数具有非默认值时,才禁用LIC。这允许使用具有默认WP参数的参考图片的双向预测CU(即,WP不被调用用于这些CU)仍然能够使用LIC。
对于单向预测情况:
仅当单向预测中使用的参考图片已经开启加权预测,即这些参考图片的(权重、偏移)参数具有非默认值时,才禁用LIC。这允许使用具有默认WP参数的参考图片的单向预测CU(即,WP不被调用用于这些CU)仍然能够使用LIC。语法以粗体文本修改如下:
表16:语法元素的示例
Figure GDA0003166038010000571
在上表中,X表示参考图片列表(X为0或1)。
对于以上示例,以下内容可能适用:
–控制每个序列的LIC的使用的sps_LIC_enabled_flag可以由每个图片/视图/条带/片/片组/CTU行/区域/多个CTU/CTU的LIC的使用的指示来代替。
–对LIC_enabled_flag的信令通知的控制还可以取决于块维度。
–在一个示例中,对LIC_enabled_flag的信令通知的控制还可以取决于GBI索引。
在一个示例中,对GBI索引的信令通知的控制还可以取决于LIC_enabled_flag。
图39是示出可用来实施本公开技术的各个部分的计算机系统或其他控制设备2600的架构的示例的框图。在图39中,计算机系统2600包括经由互连2625连接的一个或多个处理器2605和存储器2610。互连2605可以表示通过适当的网桥、适配器或控制器连接的任何一个或多个单独的物理总线、点对点连接或两者。因此,互连2625可以包括例如系统总线、外围组件互连(Peripheral Component Interconnect,PCI)总线、HyperTransport或工业标准架构(Industry Standard Architecture,ISA)总线、小型计算机系统接口(SmallComputer System Interface,SCSI)总线、通用串行总线(Universal Serial Bus,USB)、IIC(I2C)总线、或者电气和电子工程师协会(Institute of Electrical and ElectronicsEngineers,IEEE)标准674总线(有时也被称为“火线”)。
(多个)处理器2605可以包括中央处理单元(Central Processing Unit,CPU)以控制例如主计算机的整体操作。在某些实施例中,(多个)处理器2605通过运行存储在存储器2610中的软件或固件来实现这一点。(多个)处理器2605可以是或可以包括一个或多个可编程通用或专用微处理器、数字信号处理器(Digital Signal Processor,DSP)、可编程控制器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑器件(Programmable Logic Device,PLD)等、或这样的设备的组合。
存储器2610可以是或可以包括计算机系统的主存储器。存储器2610表示任何合适形式的随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、闪存等、或这样的设备的组合。在使用中,除了其他事物之外,存储器2610可以包含机器指令集,其中该机器指令集在由处理器2605运行时使得处理器2605执行操作以实施本公开技术的实施例。
通过互连2625还连接到(多个)处理器2605的是(可选的)网络适配器2615。网络适配器2615向计算机系统2600提供与诸如存储客户端和/或其他存储服务器的远程设备通信的能力,并且可以是例如以太网适配器或光纤通道适配器。
图40A示出了可用来实施本公开技术的各个部分的设备2700的示例实施例的框图。移动设备2700可以是笔记本电脑、智能电话、平板电脑、摄像机、或能够处理视频的其他类型的设备。移动设备2700包括处理器或控制器2701以处理数据,以及与处理器2701通信的存储器2702以存储和/或缓冲数据。例如,处理器2701可以包括中央处理单元(CPU)或微控制器单元(Microcontroller Unit,MCU)。在一些实施方式中,处理器2701可以包括现场可编程门阵列(Field-Programmable Gate-Array,FPGA)。在一些实施方式中,移动设备2700包括用于智能电话设备的各种视觉和/或通信数据处理功能的图形处理单元(Graphics Processing Unit,GPU)、视频处理单元(Video Processing Unit,VPU)、和/或无线通信单元,或与其通信。例如,存储器2702可以包括并存储处理器可运行代码,其中该代码在由处理器2701运行时将移动设备2700配置为执行各种操作,例如,诸如接收信息、命令和/或数据,处理信息和数据,以及将经处理的信息/数据发送或提供给诸如执行器或外部显示器的另一设备。为了支持移动设备2700的各种功能,存储器2702可以存储信息和数据,诸如指令、软件、值、图像、以及由处理器2701处理或引用的其他数据。例如,可以使用各种类型的随机存取存储器(RAM)设备、只读存储器(ROM)设备、闪存设备和其他合适的存储介质来实施存储器2702的存储功能。在一些实施方式中,移动设备2700包括输入/输出(Input/Output,I/O)单元2703,以将处理器2701和/或存储器2702接口连接到其他模块、单元或设备。例如,I/O单元2703可以与处理器2701和存储器2702接口连接,以利用与典型数据通信标准兼容的、例如诸如在云中的一个或多个计算机与用户设备之间的各种类型的无线接口。在一些实施方式中,移动设备2700可以经由I/O单元2703使用有线连接与其他设备接口连接。移动设备2700还可以与诸如数据存储装置、和/或视觉或音频显示设备2704的其他外部接口进行接口连接,以检索和传输可由处理器处理、存储在存储器中、或在显示设备2704或外部设备的输出单元上展示的数据和信息。例如,显示设备2704可以显示基于根据所公开技术的MVP而修改的视频帧。
图40B是示出可以在其中实施所公开技术的示例视频处理系统的框图的另一示例。图29是示出可以在其中实施本文公开的各种技术的示例视频处理系统2900的框图。各种实施方式可以包括系统2900的一些或所有组件。系统2900可以包括用于接收视频内容的输入2902。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入2902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(Passive Optical Network,PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统2900可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件2904。编解码组件2904可以将来自输入2902的视频的平均比特率减小到编解码组件2904的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件2904的输出可以被存储,或者经由如由组件2906表示的通信连接而发送。在输入2902处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件2908用于生成像素值或传送到显示接口2910的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(High Definition Multimedia Interface,HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(Serial Advanced Technology Attachment,串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
在一些实施例中,视频处理方法可以使用关于参考图39、图40或图40B所述的在硬件平台上实施的装置来实施。
图41A是视频处理的方法4100的流程图表示。方法4100包括,在步骤4102,对于视频的当前视频图片的当前块和视频的编解码表示之间的转换,确定对当前块的该转换启用局部照明补偿(LIC)工具和帧内块复制(IBC)工具两者。方法4100还包括,在步骤4104,基于该确定执行该转换。LIC工具在该转换期间使用当前块中的照明变化的线性模型,并且IBC工具使用当前视频图片的一部分用于当前块的该转换。
图41B是视频处理的方法4200的流程图表示。方法4200包括,在步骤4202,确定使用规则,其中该规则指定与当前图片参考(CPR)模式相排斥地使用局部照明补偿(LIC)工具用于视频的当前块和视频的编解码表示之间的转换。方法4200还包括,在步骤4204,基于该确定执行该转换。LIC工具包括在该转换期间使用当前块中的照明变化的线性模型,并且CPR模式包括使用包括当前块的当前图片的另一部分用于对当前块的预测。
图42A是用于视频处理的示例方法的流程图表示。方法5100包括,在步骤5102,执行对于视频的当前块和视频的编解码表示之间的转换,确定对该转换启用广义双向预测(GBI)工具或多假设帧间预测工具或者对该转换启用局部照明补偿(LIC)工具。方法5100还包括,在步骤5104,基于该确定执行该转换。在一些实施方式中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
图42B是用于视频处理的示例方法的流程图表示。方法5200包括,在步骤5202,确定使用局部照明补偿(LIC)工具与多假设预测工具用于视频的当前块和视频的编解码表示之间的转换。方法5200还包括,在步骤5204,基于该确定执行该转换。在一些实施方式中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
图42C是用于视频处理的示例方法的流程图表示。方法5300包括,在步骤5302,确定使用互斥的局部照明补偿(LIC)工具和加权预测工具用于当前块和当前块的编解码表示之间的转换。方法5300还包括,在步骤5304,基于该确定执行该转换。在一些实施方式中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
图43A是用于视频处理的示例方法的流程图表示。方法6100包括,在步骤6102,基于继承规则,确定是否使用局部照明补偿(LIC)模式用于视频的视频区域的当前块和视频的编解码表示之间的转换,LIC模式包括在该转换期间使用当前块中的照明变化的线性模型。方法6100还包括,在步骤6104,基于该确定执行该转换。在一些实施方式中,继承规则指定从最终运动矢量表达(UMVE)模式的基本Merge候选继承LIC模式的使用,并且UMVE模式包括使用运动矢量表达,其中该运动矢量表达包括基本Merge候选和用来细化基本Merge候选的运动信息的运动矢量差。
图43B是用于视频处理的示例方法的流程图表示。方法6200包括,在步骤6202,确定使用互斥的局部照明补偿(LIC)工具和基于子块的编解码模式。方法6200还包括,在步骤6204,基于该确定来执行视频的当前块和视频的编解码表示之间的转换。在一些实施方式中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
图43C是用于视频处理的示例方法的流程图表示。方法6300包括,在步骤6302,确定使用互斥的局部照明补偿(LIC)工具和三角形预测模式(TPM)。方法6300还包括,在步骤6304,基于该确定来执行视频的当前块和视频的编解码表示之间的转换。在一些实施方式中,LIC工具使用当前块中的照明变化的线性模型用于该转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于该转换。
图43D是用于视频处理的示例方法的流程图表示。方法6400包括,在步骤6402,对于视频的当前块和视频的编解码表示之间的转换,确定对当前块的该转换启用局部照明补偿(LIC)和三角形预测模式(TPM)模式两者。方法6400还包括,在步骤6404,基于该确定执行该转换。在一些实施方式中,LIC工具使用当前块中的照明变化的线性模型用于该转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于该转换。
各种技术和实施例可以使用以下基于条款的格式来描述。
第一条款集合描述了在先前章节中列出的所公开技术的特定特征和方面,包括例如项目3和7。
1.一种视频处理方法,包括:对于视频的当前视频图片的当前块和视频的编解码表示之间的转换,确定对当前块的该转换启用局部照明补偿(LIC)工具和帧内块复制(IBC)工具两者;以及基于该确定执行该转换,其中,LIC工具在该转换期间使用当前块中的照明变化的线性模型,并且其中,IBC工具使用当前视频图片的一部分用于当前块的该转换。
2.根据条款1所述的方法,其中,为以帧内块复制模式编解码的当前块信令通知LIC使用的指示。
3.根据条款1所述的方法,其中,当前块使用帧内块复制Merge模式,并且其中,当前块继承邻近块的LIC标志值。
4.根据条款1所述的方法,其中,当前块使用帧内块复制Merge模式,并且其中,当前块继承邻近块的LIC参数。
5.根据条款1所述的方法,其中,LIC标志为真,并且LIC参数是隐式地推导的。
6.根据条款1所述的方法,其中,基于确定当前块是当前块所在的编解码树单元(CTU)的边界块,LIC操作被执行。
7.根据条款1所述的方法,其中,基于确定当前块是当前块所在的编解码树单元(CTU)的内部块,LIC操作被执行。
8.根据条款1所述的方法,其中,为以LIC模式编解码的当前块信令通知IBC使用的指示。
9.一种视频处理方法,包括:确定使用规则,其中该规则指定与当前图片参考(CPR)模式相排斥地使用局部照明补偿(LIC)工具用于视频的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换,其中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型,并且其中,CPR模式包括使用包括当前块的当前图片的另一部分用于对当前块的预测。
10.根据条款9所述的方法,其中,在对当前块启用CPR模式的情况下,跳过对LIC使用的指示的信令通知。
11.根据条款9所述的方法,其中,在对当前块启用LIC模式的情况下,跳过对CPR使用的指示的信令通知。
12.根据条款1至11中任一项所述的方法,其中,该转换的执行包括从当前块生成编解码表示。
13.根据条款1至11中任一项所述的方法,其中,该转换的执行包括从编解码表示生成当前块。
14.一种视频系统中的装置,包括处理器和其上有指令的非暂时性存储器,其中该指令在由处理器执行时使得处理器实施根据条款1至13中的一项或多项所述的方法。
15.一种存储在非暂时性计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行根据条款1至13中的一项或多项所述的方法的程序代码。
第二条款集合描述了在先前章节中列出的所公开技术的特定特征和方面,包括例如项目4、5、6和8。
1.一种视频处理方法,包括:执行对于视频的当前块和视频的编解码表示之间的转换,确定对该转换启用广义双向预测(GBI)工具或多假设帧间预测工具或者对该转换启用局部照明补偿(LIC)工具;以及基于该确定执行该转换,其中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
2.根据条款1所述的方法,其中,LIC标志为真,并且其中,编解码表示不包括与GBI工具或多假设帧间预测工具相关联的一个或多个语法元素。
3.根据条款2所述的方法,其中,GBI工具或多假设帧间预测工具被禁用,并且LIC工具被启用。
4.根据条款1所述的方法,其中,GBI工具中的不相等权重被施加于当前块的预测块,并且其中,编解码表示不包括与LIC工具或多假设帧间预测工具相关联的一个或多个语法元素。
5.根据条款4所述的方法,其中,LIC工具或多假设帧间预测工具被禁用,并且具有不相等权重的GBI工具被启用。
6.根据条款1所述的方法,其中,多假设帧间预测工具被启用,并且其中,编解码表示不包括与LIC工具或GBI工具相关联的一个或多个语法元素。
7.根据条款6所述的方法,其中,LIC工具或GBI工具被禁用,并且多假设帧间预测被启用。
8.根据条款1所述的方法,其中,LIC工具、GBI工具、多假设帧间预测工具被顺序检查。
9.根据条款1所述的方法,其中,与GBI工具相关联的信息是在与LIC工具相关联的信息之后信令通知的。
10.根据条款9所述的方法,其中,是否信令通知GBI信息取决于与当前块或包含当前块的当前片、片组或图片的至少一个参考图片相关联的LIC信息或加权预测信息中的至少一个。
11.根据条款1所述的方法,其中,与LIC工具相关联的信息是在与GBI工具相关联的信息之后信令通知的。
12.根据条款11所述的方法,其中,是否信令通知LIC信息取决于与当前块或包含当前块的当前片、片组或图片的至少一个参考图片相关联的GBI信息或加权预测信息中的至少一个。
13.根据条款9或10所述的方法,其中,该信息是在序列参数集(SPS)、图片参数集(PPS)、条带头、片组头、片、编解码单元(CU)或编解码树单元(CTU)中信令通知的。
14.根据条款1所述的方法,其中,与LIC工具相关联的信息是在与多假设帧间预测工具相关联的信息之后信令通知的。
15.根据条款1所述的方法,其中,与多假设帧间预测工具相关联的信息是在与LIC工具相关联的信息之后信令通知的。
16.根据条款8所述的方法,其中,该顺序取决于先前编解码的信息或当前块的编解码信息中的至少一个。
17.根据条款1所述的方法,其中在对具有两个或更多个参考图片的不相等权重的当前块启用GBI工具的情况下,LIC工具或多假设帧间预测工具所需的语法元素不被信令通知。
18.根据条款1-17中任一项所述的方法,其中,当前块是单向预测。
19.一种用于视频处理的方法,包括:确定使用局部照明补偿(LIC)工具与多假设预测工具用于视频的当前块和视频的编解码表示之间的转换;以及基于该确定执行该转换,其中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
20.根据条款19所述的方法,其中,为多假设高级运动矢量预测(AMVP)和Merge模式信令通知LIC标志。
21.根据条款20所述的方法,其中,LIC标志被应用于AMVP模式和Merge模式两者,或者仅被应用于AMVP模式。
22.根据条款19所述的方法,其中,不信令通知LIC标志,并且对AMVP模式禁用LIC。
23.根据条款19所述的方法,其中,LIC标志是从多假设Merge模式的对应Merge候选继承的。
24.根据条款19所述的方法,其中,为多假设帧间预测模式信令通知LIC标志。
25.根据条款24所述的方法,其中,用附加运动信息和Merge模式或UMVE(最终运动矢量表达)模式两者预测当前块,并且其中,LIC标志被应用于附加信息和Merge模式或附加运动信息两者,或者仅被应用于附加运动信息。
26.根据条款24所述的方法,其中,用附加运动信息和Merge模式或UMVE(最终运动矢量表达)模式两者预测当前块,并且其中,不信令通知LIC标志并对附加运动信息禁用LIC标志。
27.根据条款24所述的方法,其中,用附加运动信息和AMVP模式两者预测当前块,并且其中,LIC标志被应用于AMVP模式和附加运动信息两者。
28.根据条款25-27中任一项所述的方法,其中,不同的LIC参数被推导或继承以用于Merge模式、UMVE模式、AMVP模式和附加运动信息。
29.根据条款19所述的方法,其中,在将多假设预测应用于当前块的情况下,LIC被应用于少于所有预测信号的特定预测信号。
30.根据条款19所述的方法,其中,在将多假设预测应用于当前块的情况下,信令通知或推导了一个或多个标志以指示LIC的使用。
31.一种用于视频处理的方法,包括:确定使用互斥的局部照明补偿(LIC)工具和加权预测工具用于当前块和当前块的编解码表示之间的转换;以及基于该确定执行该转换,其中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
32.根据条款31所述的方法,其中,该确定对由于确定加权预测工具被用于块的至少一个参考图片而禁用LIC工具进行确定。
33.根据条款31所述的方法,其中,该确定对由于确定加权预测工具被用于块的所有参考图片而禁用LIC工具进行确定。
34.根据条款31所述的方法,其中,LIC信息的信令通知取决于是否对当前块启用加权预测。
35.根据条款34所述的方法,其中,是否对当前块启用加权预测还取决于当前块是双向预测还是单向预测。
36.根据条款31所述的方法,其中,LIC信息的信令通知取决于与一个或所有参考图片相关联的加权预测参数,其中该一个或所有参考图片与当前块相关联。
37.根据条款31所述的方法,其中,对当前块的至少一些参考图片启用加权预测工具,并且其中,对当前块禁用LIC工具。
38.根据条款37所述的方法,其中,与LIC工具相关联的一个或多个语法元素从编解码表示中排除。
39.根据条款31所述的方法,其中,对当前块的至少一些参考图片启用加权预测工具,并且其中,LIC工具被应用于当前块,并且对当前块禁用加权预测工具。
40.根据条款31所述的方法,其中,加权预测工具和LIC工具两者都被应用于当前块。
41.根据条款31所述的方法,其中,LIC工具和加权预测工具在图片级别、条带级别、片组级别或CTU(编解码树单元)组级别被互斥地使用。
42.根据条款41所述的方法,其中,对图片、条带、片组、CTU组的至少一些参考图片启用加权预测工具,并且其中,LIC工具被禁用。
43.根据条款42所述的方法,其中,对图片、条带、片组、CTU组的至少一些参考图片启用LIC工具,并且其中,对至少一些参考图片禁用加权预测工具。
44.根据条款1至43中的任一项所述的方法,其中,该转换的执行包括从当前块生成编解码表示。
45.根据条款1至43中的任一项所述的方法,其中,该转换的执行包括从编解码表示生成当前块。
46.一种视频系统中的装置,包括处理器和其上有指令的非暂时性存储器,其中该指令在由处理器执行时使得处理器实施根据条款1至45中的一项或多项所述的方法。
47.一种存储在非暂时性计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行根据条款1至45中的一项或多项所述的方法的程序代码。
第三条款集合描述了在先前部分中列出的所公开技术的特定特征和方面,包括例如项目4和9。
1.一种用于视频处理的方法,包括:基于继承规则,确定是否使用局部照明补偿(LIC)模式用于视频的视频区域的当前块和视频的编解码表示之间的转换,LIC模式包括在该转换期间使用当前块中的照明变化的线性模型;以及基于该确定执行该转换,其中,该继承规则指定从最终运动矢量表达(UMVE)模式的基本Merge候选继承LIC模式的使用,并且其中,UMVE模式包括使用运动矢量表达,其中该运动矢量表达包括基本Merge候选和用来细化基本Merge候选的运动信息的运动矢量差。
2.根据条款1所述的方法,其中,LIC参数是基于视频的当前编解码单元(CU)的邻近样点而推导的。
3.根据条款2所述的方法,其中,LIC参数是为在UMVE模式下编解码的视频区域的边界上的块推导的。
4.根据条款1所述的方法,其中,LIC参数是从视频区域内部的块的基本Merge候选继承的。
5.根据条款1所述的方法,其中,LIC标志在UMVE模式下被显式地信令通知。
6.一种用于视频处理的方法,包括:确定使用互斥的局部照明补偿(LIC)工具和基于子块的编解码模式;以及基于该确定来执行视频的当前块和视频的编解码表示之间的转换,其中,LIC工具包括在该转换期间使用当前块中的照明变化的线性模型。
7.根据条款6所述的方法,其中,基于子块的编解码模式包括仿射模式。
8.根据条款6所述的方法,其中,该确定对由于当前块以基于子块的编解码模式编解码而在该转换中禁用LIC工具进行确定。
9.一种用于视频处理的方法,包括:确定使用互斥的局部照明补偿(LIC)工具和三角形预测模式(TPM);以及基于该确定来执行视频的当前块和视频的编解码表示之间的转换,其中,LIC工具使用当前块中的照明变化的线性模型用于该转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于该转换。
10.根据条款9所述的方法,其中,该确定对三角形预测模式被启用并且该转换通过禁用LIC工具而执行进行确定。
11.一种用于视频处理的方法,包括:对于视频的当前块和视频的编解码表示之间的转换,确定对当前块的该转换启用局部照明补偿(LIC)和三角形预测模式(TPM)模式两者;以及基于该确定执行该转换,其中,LIC工具使用当前块中的照明变化的线性模型用于该转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于该转换。
12.根据条款11所述的方法,其中,TPM Merge候选的LIC标志是从空域或时域块或者其他运动候选继承的。
13.根据条款12所述的方法,其中,其他运动候选包括HMVP(基于历史的运动矢量预测)候选。
14.根据条款11所述的方法,其中,TPM Merge候选的LIC标志是从一些空域或时域块继承的。
15.根据条款9所述的方法,其中,TMP Merge候选的LIC标志被设置为假。
16.根据条款1至15中的任一项所述的方法,其中,该转换的执行包括从当前块生成编解码表示。
17.根据条款1至15中的任一项所述的方法,其中,该转换的执行包括从编解码表示生成当前块。
18.一种视频系统中的装置,包括处理器和其上有指令的非暂时性存储器,其中该指令在由处理器执行时使得处理器实施根据条款1至17中的一项或多项所述的方法。
19.一种存储在非暂时性计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行根据条款1至17中的一项或多项所述的方法的程序代码。
所公开技术的一些实施例包括做出启用视频处理工具或模式的决定或确定。在示例中,当视频处理工具或模式被启用时,编码器将在视频块的处理中使用或实施该工具或模式,但是不一定基于工具或模式的使用来修改产生的比特流。也就是说,当基于决定或确定启用视频处理工具或模式时,从视频的块到视频的比特流表示的转换将使用该视频处理工具或模式。在另一示例中,当视频处理工具或模式被启用时,解码器将在知道比特流已经基于视频处理工具或模式而修改的情况下处理比特流。也就是说,将使用基于该决定或该确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频的块的转换。
所公开技术的一些实施例包括做出禁用视频处理工具或模式的决定或确定。在示例中,当视频处理工具或模式被禁用时,编码器将不在视频的块到视频的比特流表示的转换中使用该工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将在知道比特流还没有使用基于该决定或该确定而启用的视频处理工具或模式而修改的情况下处理比特流。
本文档中描述的所公开的以及其他实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品,即在计算机可读介质上编码的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号,例如机器生成的电信号、光学信号或电磁信号。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上运行。
本文档书中描述的过程和逻辑流程可以由运行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(Field Programmable Gate Array,现场可编程门阵列)或ASIC(专用集成电路)。
适合于运行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可换式磁盘;磁光盘;以及CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何发明或可能要求保护的范围的限制,而是作为特定于特定发明的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims (19)

1.一种用于视频处理的方法,包括:
基于继承规则,确定是否使用局部照明补偿(LIC)模式用于视频的视频区域的当前块和视频的编解码表示之间的转换,LIC模式包括在该转换期间使用当前块中的照明变化的线性模型;以及
基于所述确定执行所述转换,
其中,所述继承规则指定从最终运动矢量表达(UMVE)模式的基本Merge候选继承LIC模式的使用,并且
其中,UMVE模式包括使用运动矢量表达,其中所述运动矢量表达包括基本Merge候选和用来细化基本Merge候选的运动信息的运动矢量差。
2.根据权利要求1所述的方法,其中,LIC参数是基于所述视频的当前编解码单元(CU)的邻近样点而推导的。
3.根据权利要求2所述的方法,其中,LIC参数是为在UMVE模式下编解码的所述视频区域的边界上的块推导的。
4.根据权利要求1所述的方法,其中,LIC参数是从所述视频区域内部的块的基本Merge候选继承的。
5.根据权利要求1所述的方法,其中,所述LIC标志在UMVE模式下被显式地信令通知。
6.一种用于视频处理的方法,包括:
确定使用互斥的局部照明补偿(LIC)工具和基于子块的编解码模式;以及
基于所述确定来执行视频的当前块和视频的编解码表示之间的转换,
其中,LIC工具包括在所述转换期间使用当前块中的照明变化的线性模型。
7.根据权利要求6所述的方法,其中,所述基于子块的编解码模式包括仿射模式。
8.根据权利要求6所述的方法,其中,所述确定对由于所述当前块以基于子块的编解码模式编解码而在所述转换中禁用所述LIC工具进行确定。
9.一种用于视频处理的方法,包括:
确定使用互斥的局部照明补偿(LIC)工具和三角形预测模式(TPM);以及
基于所述确定来执行视频的当前块和视频的编解码表示之间的转换,
其中,LIC工具使用当前块中的照明变化的线性模型用于所述转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于所述转换。
10.根据权利要求9所述的方法,其中,所述确定对三角形预测模式被启用并且所述转换通过禁用所述LIC工具而执行进行确定。
11.一种用于视频处理的方法,包括:
对于视频的当前块和视频的编解码表示之间的转换,确定对当前块的所述转换启用局部照明补偿(LIC)和三角形预测模式(TPM)模式两者;以及
基于所述确定执行所述转换,
其中,LIC工具使用当前块中的照明变化的线性模型用于所述转换,并且TPM包括将视频区域分为至少两个非矩形部分以用于所述转换。
12.根据权利要求11所述的方法,其中,TPM Merge候选的LIC标志是从空域或时域块或者其他运动候选继承的。
13.根据权利要求12所述的方法,其中,所述其他运动候选包括HMVP(基于历史的运动矢量预测)候选。
14.根据权利要求11所述的方法,其中,TPM Merge候选的LIC标志是从一些空域或时域块继承的。
15.根据权利要求9所述的方法,其中,TMP Merge候选的LIC标志被设置为假。
16.根据权利要求1至15中的任一项所述的方法,其中,所述转换的执行包括从所述当前块生成所述编解码表示。
17.根据权利要求1至15中的任一项所述的方法,其中,所述转换的执行包括从所述编解码表示生成所述当前块。
18.一种视频系统中的装置,包括处理器和其上有指令的非暂时性存储器,其中所述指令在由处理器执行时使得处理器实施根据权利要求1至17中的一项或多项所述的方法。
19.一种存储在非暂时性计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于执行根据权利要求1至17中的一项或多项所述的方法的程序代码。
CN201980068629.0A 2018-10-23 2019-10-23 并置的局部照明补偿和修改的帧间编解码工具 Active CN113287317B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2018/111436 2018-10-23
CN2018111436 2018-10-23
CN2019071759 2019-01-15
CNPCT/CN2019/071759 2019-01-15
PCT/IB2019/059050 WO2020084509A1 (en) 2018-10-23 2019-10-23 Harmonized local illumination compensation and modified inter coding tools

Publications (2)

Publication Number Publication Date
CN113287317A true CN113287317A (zh) 2021-08-20
CN113287317B CN113287317B (zh) 2023-04-28

Family

ID=68387363

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201980068531.5A Active CN112868239B (zh) 2018-10-23 2019-10-23 并置的局部照明补偿和帧内块复制编解码
CN201980068629.0A Active CN113287317B (zh) 2018-10-23 2019-10-23 并置的局部照明补偿和修改的帧间编解码工具
CN201980068525.XA Active CN112868238B (zh) 2018-10-23 2019-10-23 局部照明补偿和帧间预测编解码之间的并置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201980068531.5A Active CN112868239B (zh) 2018-10-23 2019-10-23 并置的局部照明补偿和帧内块复制编解码

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980068525.XA Active CN112868238B (zh) 2018-10-23 2019-10-23 局部照明补偿和帧间预测编解码之间的并置

Country Status (3)

Country Link
US (4) US11405607B2 (zh)
CN (3) CN112868239B (zh)
WO (3) WO2020084509A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024199503A1 (en) * 2023-03-30 2024-10-03 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116939198A (zh) 2018-10-23 2023-10-24 北京字节跳动网络技术有限公司 并置的局部照明补偿和修改的帧间预测编解码
CN112868239B (zh) 2018-10-23 2023-05-30 北京字节跳动网络技术有限公司 并置的局部照明补偿和帧内块复制编解码
US11290743B2 (en) * 2018-12-08 2022-03-29 Qualcomm Incorporated Interaction of illumination compensation with inter-prediction
WO2020139903A1 (en) * 2018-12-25 2020-07-02 Beijing Dajia Internet Information Technology Co., Ltd. Video coding with triangular shape prediction units
CN113302918A (zh) 2019-01-15 2021-08-24 北京字节跳动网络技术有限公司 视频编解码中的加权预测
WO2020147804A1 (en) 2019-01-17 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Use of virtual candidate prediction and weighted prediction in video processing
CN111526362B (zh) * 2019-02-01 2023-12-29 华为技术有限公司 帧间预测方法和装置
CN113383548A (zh) 2019-02-03 2021-09-10 北京字节跳动网络技术有限公司 Mv精度和mv差编解码之间的相互作用
CN113424533B (zh) 2019-02-14 2024-09-10 北京字节跳动网络技术有限公司 复杂度降低的解码器侧运动推导
CN117692630A (zh) 2019-05-11 2024-03-12 北京字节跳动网络技术有限公司 视频处理中编解码工具的选择性使用
WO2020244658A1 (en) 2019-06-06 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Sub-block based intra block copy
WO2020253650A1 (en) 2019-06-16 2020-12-24 Beijing Bytedance Network Technology Co., Ltd. Interaction between screen content coding tools and motion information
MX2021016105A (es) * 2019-06-21 2022-04-06 Huawei Tech Co Ltd Un codificador, un decodificador y metodos correspondientes.
WO2020259426A1 (en) 2019-06-22 2020-12-30 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction for intra block copy mode
CN114365488A (zh) 2019-09-09 2022-04-15 北京字节跳动网络技术有限公司 视频编解码块的递归划分
JP6960969B2 (ja) * 2019-09-20 2021-11-05 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
JP2022552511A (ja) 2019-10-12 2022-12-16 北京字節跳動網絡技術有限公司 ビデオコーディングツールのための高レベルシンタックス
US12113987B2 (en) * 2020-12-22 2024-10-08 Qualcomm Incorporated Multi-pass decoder-side motion vector refinement
WO2022140160A1 (en) * 2020-12-23 2022-06-30 Qualcomm Incorporated Multiple hypothesis prediction for video coding
MX2023008942A (es) * 2021-02-08 2023-09-18 Interdigital Ce Patent Holdings Sas Compensación de iluminación local espacial.
US20220311997A1 (en) * 2021-03-29 2022-09-29 Qualcomm Incorporated Adaptively coding motion information for multiple hypothesis prediction for video coding
WO2023284694A1 (en) * 2021-07-15 2023-01-19 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023198203A1 (en) * 2022-04-14 2023-10-19 FG Innovation Company Limited Method related to illumination compensation and electronic device
WO2024078551A1 (en) * 2022-10-13 2024-04-18 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing
WO2024096709A1 (ko) * 2022-11-06 2024-05-10 엘지전자 주식회사 Amvpmerge 모드에 기반한 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체
WO2024108169A1 (en) * 2022-11-18 2024-05-23 Comcast Cable Communications, Llc Improved prediction with local illumination compensation
WO2024120356A1 (en) * 2022-12-05 2024-06-13 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing
WO2024153153A1 (en) * 2023-01-19 2024-07-25 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing
WO2024173443A1 (en) * 2023-02-14 2024-08-22 Beijing Dajia Internet Information Technology Co., Ltd Methods and devices for intra block copy and intra template matching
WO2024207440A1 (zh) * 2023-04-07 2024-10-10 Oppo广东移动通信有限公司 解码方法、编码方法、解码器以及编码器
WO2024207434A1 (zh) * 2023-04-07 2024-10-10 Oppo广东移动通信有限公司 视频编解码方法、装置、设备、系统、及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160366416A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
CN107147911A (zh) * 2017-07-05 2017-09-08 中南大学 基于局部亮度补偿lic的快速帧间编码模式选择方法及装置
US20170332099A1 (en) * 2016-05-13 2017-11-16 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
CN108632629A (zh) * 2014-03-19 2018-10-09 株式会社Kt 针对多视图视频信号生成合并候选列表的方法及解码装置

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2636218T3 (da) 2010-11-04 2021-10-04 Ge Video Compression Llc Billedkodning, som understøtter blokfletning og skipmodus
US9270993B2 (en) 2012-09-10 2016-02-23 Apple Inc. Video deblocking filter strength derivation
US9584808B2 (en) 2013-02-22 2017-02-28 Qualcomm Incorporated Device and method for scalable coding of video information
KR102118524B1 (ko) 2013-04-05 2020-06-09 브이아이디 스케일, 인크. 다수의 레이어 비디오 코딩을 위한 레이어간 참조 화상 강화
CN105122796B (zh) 2013-04-12 2019-03-29 寰发股份有限公司 三维或多视图编码及解码系统中照度补偿的方法
US9860529B2 (en) * 2013-07-16 2018-01-02 Qualcomm Incorporated Processing illumination compensation for video coding
CN103561263B (zh) * 2013-11-06 2016-08-24 北京牡丹电子集团有限责任公司数字电视技术中心 基于运动矢量约束和加权运动矢量的运动补偿预测方法
DE112015000184T5 (de) 2014-06-20 2016-07-07 Mediatek Inc. Verfahren der Codierung für eine tiefenbasierte Blockpartitionierungsart in dreidimensionaler oder Multiview-Videocodierung
US10212445B2 (en) * 2014-10-09 2019-02-19 Qualcomm Incorporated Intra block copy prediction restrictions for parallel processing
CN107113425A (zh) 2014-11-06 2017-08-29 三星电子株式会社 视频编码方法和设备以及视频解码方法和设备
US10887597B2 (en) * 2015-06-09 2021-01-05 Qualcomm Incorporated Systems and methods of determining illumination compensation parameters for video coding
EP3313072B1 (en) 2015-06-16 2021-04-07 LG Electronics Inc. Method for predicting block on basis of illumination compensation in image coding system
US10200719B2 (en) 2015-11-25 2019-02-05 Qualcomm Incorporated Modification of transform coefficients for non-square transform units in video coding
US10798403B2 (en) 2016-01-29 2020-10-06 Sharp Kabushiki Kaisha Prediction image generation device, video decoding device, and video coding device
EP3456049B1 (en) * 2016-05-13 2022-05-04 VID SCALE, Inc. Systems and methods for generalized multi-hypothesis prediction for video coding
US20170339405A1 (en) 2016-05-20 2017-11-23 Arris Enterprises Llc System and method for intra coding
US10390015B2 (en) * 2016-08-26 2019-08-20 Qualcomm Incorporated Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction
KR102147447B1 (ko) 2016-09-22 2020-08-24 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측 방법 및 장치
US10805631B2 (en) 2016-09-23 2020-10-13 Lg Electronics Inc. Method and apparatus for performing prediction using template-based weight
WO2018062892A1 (ko) 2016-09-28 2018-04-05 엘지전자(주) 가중치 인덱스에 기초하여 최적의 예측을 수행하는 방법 및 장치
US10631002B2 (en) * 2016-09-30 2020-04-21 Qualcomm Incorporated Frame rate up-conversion coding mode
US10880570B2 (en) 2016-10-05 2020-12-29 Qualcomm Incorporated Systems and methods of adaptively determining template size for illumination compensation
US10750203B2 (en) 2016-12-22 2020-08-18 Mediatek Inc. Method and apparatus of adaptive bi-prediction for video coding
US20180184127A1 (en) 2016-12-22 2018-06-28 Qualcomm Incorporated Determining neighboring samples for bilateral filtering in video coding
WO2018123444A1 (ja) 2016-12-28 2018-07-05 ソニー株式会社 画像処理装置及び画像処理方法
EP3343925A1 (en) * 2017-01-03 2018-07-04 Thomson Licensing Method and apparatus for encoding and decoding motion information
US10869063B2 (en) 2017-01-10 2020-12-15 Telefonaktiebolaget Lm Ericsson (Publ) Deblocking filtering control
US10542264B2 (en) 2017-04-04 2020-01-21 Arris Enterprises Llc Memory reduction implementation for weighted angular prediction
US20180332298A1 (en) 2017-05-10 2018-11-15 Futurewei Technologies, Inc. Bidirectional Prediction In Video Compression
CN118337990A (zh) 2017-06-26 2024-07-12 交互数字麦迪逊专利控股公司 利用多个加权参考进行帧内预测的方法和装置
WO2019001685A1 (en) 2017-06-26 2019-01-03 Telefonaktiebolaget Lm Ericsson (Publ) METHOD AND APPARATUS FOR WEIGHTED VIDEO CODING PREDICTION
WO2019006363A1 (en) 2017-06-30 2019-01-03 Vid Scale, Inc. LOCAL LIGHTING COMPENSATION USING GENERALIZED BI-PREDICTION
WO2019007697A1 (en) 2017-07-05 2019-01-10 Telefonaktiebolaget Lm Ericsson (Publ) UNBLOCKING FILTER CONTROL FOR LIGHTING COMPENSATION
WO2019010267A1 (en) 2017-07-05 2019-01-10 Arris Enterprises Llc POST-FILTERING FOR WEIGHTED ANGULAR PREDICTION
MX2020001886A (es) 2017-08-22 2020-03-24 Panasonic Ip Corp America Codificador de imagen, descodificador de imagen, metodo de codificacion de imagen y metodo de descodificacion de imagen.
US11082708B2 (en) 2018-01-08 2021-08-03 Qualcomm Incorporated Multiple-model local illumination compensation
EP3738310A4 (en) 2018-01-11 2021-08-11 Qualcomm Incorporated VIDEO ENCODING USING LOCAL LIGHTING COMPENSATION
CN118646861A (zh) 2018-01-16 2024-09-13 交互数字Vc控股公司 基于局部照明补偿的运动补偿双向预测
US10652571B2 (en) 2018-01-25 2020-05-12 Qualcomm Incorporated Advanced motion vector prediction speedups for video coding
EP3518543A1 (en) * 2018-01-26 2019-07-31 Thomson Licensing Illumination compensation flag in frame rate up-conversion with template matching
US10715810B2 (en) 2018-02-20 2020-07-14 Qualcomm Incorporated Simplified local illumination compensation
US11297348B2 (en) * 2018-04-13 2022-04-05 Mediatek Inc. Implicit transform settings for coding a block of pixels
CN112042189B (zh) * 2018-04-30 2023-07-21 寰发股份有限公司 照度补偿方法及相应的电子装置
JP7545331B2 (ja) * 2018-05-09 2024-09-04 インターデジタル ヴイシー ホールディングス, インコーポレイテッド ビデオ符号化及び復号化の動き補償
CN117834909A (zh) 2018-07-02 2024-04-05 英迪股份有限公司 对视频进行解码的方法和对视频进行编码的方法
US11051036B2 (en) 2018-07-14 2021-06-29 Mediatek Inc. Method and apparatus of constrained overlapped block motion compensation in video coding
MX2021003048A (es) 2018-09-13 2021-08-11 Huawei Tech Co Ltd Aparato y método para refinamiento condicional de vector de movimiento de lado de decodificador en codificación de vídeo.
WO2020055288A2 (en) 2018-09-16 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding with look-up table selected based on bitstream information
WO2020060843A1 (en) 2018-09-19 2020-03-26 Interdigital Vc Holdings, Inc. Generalized bi-prediction index coding
WO2020059611A1 (ja) * 2018-09-20 2020-03-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11146800B2 (en) * 2018-09-24 2021-10-12 Tencent America LLC Low latency local illumination compensation
US11051034B2 (en) 2018-10-08 2021-06-29 Qualcomm Incorporated History-based motion vector predictor
CN116939198A (zh) 2018-10-23 2023-10-24 北京字节跳动网络技术有限公司 并置的局部照明补偿和修改的帧间预测编解码
CN112868239B (zh) 2018-10-23 2023-05-30 北京字节跳动网络技术有限公司 并置的局部照明补偿和帧内块复制编解码
CN113170146B (zh) 2018-11-21 2024-08-27 交互数字Vc控股公司 用于图片编码和解码的方法和设备
EP3657794A1 (en) 2018-11-21 2020-05-27 InterDigital VC Holdings, Inc. Method and device for picture encoding and decoding
US11394989B2 (en) 2018-12-10 2022-07-19 Tencent America LLC Method and apparatus for video coding
US10855992B2 (en) 2018-12-20 2020-12-01 Alibaba Group Holding Limited On block level bi-prediction with weighted averaging
US11134246B2 (en) 2019-01-02 2021-09-28 Shumaker & Sieffert, P.A. Weighted prediction for video coding
US11153590B2 (en) 2019-01-11 2021-10-19 Tencent America LLC Method and apparatus for video coding
CN113302918A (zh) 2019-01-15 2021-08-24 北京字节跳动网络技术有限公司 视频编解码中的加权预测
WO2020147745A1 (en) 2019-01-15 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidate lists that use local illumination compensation
US11206396B2 (en) 2019-01-16 2021-12-21 Qualcomm Incorporated Local illumination compensation in video coding
WO2020147804A1 (en) 2019-01-17 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Use of virtual candidate prediction and weighted prediction in video processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108632629A (zh) * 2014-03-19 2018-10-09 株式会社Kt 针对多视图视频信号生成合并候选列表的方法及解码装置
US20160366416A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
US20170332099A1 (en) * 2016-05-13 2017-11-16 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
CN107147911A (zh) * 2017-07-05 2017-09-08 中南大学 基于局部亮度补偿lic的快速帧间编码模式选择方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAITAO YANG等: "Description of CE4: Inter prediction and motion vector coding", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11;10TH MEETING: SAN DIEGO, US, 10–20 APR. 2018;NO.JVET-J1024》 *
JIANLE CHEN等: "Algorithm Description of Joint Exploration Test Model 7 (JEM 7)", 《JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11;7TH MEETING: TORINO, IT, 13–21 JULY 2017;NO. JVET-G1001》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024199503A1 (en) * 2023-03-30 2024-10-03 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Also Published As

Publication number Publication date
US20210235092A1 (en) 2021-07-29
US11758124B2 (en) 2023-09-12
WO2020084508A1 (en) 2020-04-30
CN112868238A (zh) 2021-05-28
US11405607B2 (en) 2022-08-02
CN112868239A (zh) 2021-05-28
CN112868239B (zh) 2023-05-30
US20230388488A1 (en) 2023-11-30
WO2020084509A1 (en) 2020-04-30
WO2020084506A1 (en) 2020-04-30
CN112868238B (zh) 2023-04-21
US20210235110A1 (en) 2021-07-29
US11470307B2 (en) 2022-10-11
US20210235074A1 (en) 2021-07-29
CN113287317B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN112868240B (zh) 并置的局部照明补偿和修改的帧间预测编解码
CN112868239B (zh) 并置的局部照明补偿和帧内块复制编解码
CN113316933B (zh) 使用运动预测进行去方块滤波
CN112913249B (zh) 广义双向预测索引的简化编解码
CN110620932B (zh) 依赖模式的运动矢量差精度集
CN113424525B (zh) 解码器侧细化工具的尺寸选择性应用
CN113302918A (zh) 视频编解码中的加权预测
CN113316935A (zh) 使用局部照明补偿的运动候选列表
CN110891174B (zh) 不同视频块尺寸的仿射模式计算
CN111083492A (zh) 双向光流中的梯度计算
CN112956197A (zh) 基于编解码信息的解码器侧运动矢量推导的限制
CN113056914A (zh) 基于部分位置的差计算
JP2024015289A (ja) オプティカルフローベースの予測精緻化の計算
KR20210089155A (ko) 페어와이즈 평균 후보 계산에서 라운딩
TWI719522B (zh) 用於視頻編碼的對稱性雙向預測模式
CN111083484A (zh) 基于子块的预测
CN113853793A (zh) 基于光流的帧间编码的语法信令
CN114175636A (zh) 自适应参数集中的自适应环路滤波的指示
CN113273208A (zh) 仿射预测模式的改进

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant