[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPWO2020192644A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020192644A5
JPWO2020192644A5 JP2021556952A JP2021556952A JPWO2020192644A5 JP WO2020192644 A5 JPWO2020192644 A5 JP WO2020192644A5 JP 2021556952 A JP2021556952 A JP 2021556952A JP 2021556952 A JP2021556952 A JP 2021556952A JP WO2020192644 A5 JPWO2020192644 A5 JP WO2020192644A5
Authority
JP
Japan
Prior art keywords
clipping
video
index
filtering
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021556952A
Other languages
Japanese (ja)
Other versions
JP2022528051A (en
JP7234406B2 (en
Publication date
Application filed filed Critical
Priority claimed from PCT/CN2020/080827 external-priority patent/WO2020192644A1/en
Publication of JP2022528051A publication Critical patent/JP2022528051A/en
Publication of JPWO2020192644A5 publication Critical patent/JPWO2020192644A5/ja
Priority to JP2023026362A priority Critical patent/JP7490102B2/en
Application granted granted Critical
Publication of JP7234406B2 publication Critical patent/JP7234406B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、ビデオ処理技術、装置、およびシステムに関する。 The present invention relates to video processing techniques, devices and systems.

関連出願の相互参照
本出願は、2020年3月24日に出願された国際特許出願第PCT/CN2020/080827号の国内移行であり、2019年3月24日に出願された国際特許出願第PCT/CN2019/079395号について優先権及び利益を主張するものである。法に基づく全ての目的のために、前述の全ての出願は、ここにおいて、本出願の開示の一部として引用により援用されている。
Cross-reference to related applications
This application is the national phase of International Patent Application No. PCT/CN2020/080827, filed March 24, 2020, International Patent Application No. PCT/CN2019/079395 , filed March 24, 2019 claiming priority and benefit of For all statutory purposes, all of the aforementioned applications are hereby incorporated by reference as part of the disclosure of this application.

ビデオ圧縮の進歩にもかかわらず、デジタルビデオは、依然として、インターネットおよび他のデジタル通信ネットワークにおける最大の帯域幅使用を占めている。映像の受信および表示が可能な接続ユーザデバイスの数が増加するにつれて、デジタル映像の利用に対する帯域幅需要は増加し続けることが予想されている。 Despite advances in video compression, digital video still accounts for the largest bandwidth usage on the Internet and other digital communication networks. It is expected that the bandwidth demand for digital video utilization will continue to increase as the number of connected user devices capable of receiving and displaying video increases.

デジタルビデオ処理、および、例えば、ビデオ処理のための非線形適応ループフィルタリング(non-linear adaptive loop filtering)に関連する装置、システムおよび、方法が説明ついてされる。説明される方法は、既存のビデオコーディング標準(例えば、高効率ビデオコーディング(High Efficiency Video Coding、HEVC))および、将来のビデオコーディング標準(例えば、汎用ビデオコーディング(Versatile Video Coding、VVC))またはコーデックの両方に対して適用され得る。 Apparatuses, systems and methods related to digital video processing and, for example, non-linear adaptive loop filtering for video processing are described. The methods described are compatible with existing video coding standards (e.g., High Efficiency Video Coding (HEVC)) and future video coding standards (e.g., Versatile Video Coding (VVC)) or codecs. can be applied to both

1つの代表的な態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、ビデオのビデオユニットを符号化ビデオユニットとして符号化するステップと、前記符号化ビデオユニットから再構成サンプルを生成するステップと、前記再構成サンプルに対してクリッピング動作を実行するステップであり、前記クリッピング動作で使用されるクリッピングパラメータは、クリッピングインデックス、および、前記再構成サンプルのビット深度または前記ビデオユニットのサンプルのビット深度に係る関数である、ステップと、前記クリッピング動作の出力に対して非線形適応ループフィルタを適用するステップと、前記符号化ビデオユニットを使用して、前記ビデオのコード化表現を生成するステップと、を含む。 In one representative aspect, the disclosed technology can be used to provide a video processing method. The method comprises the steps of encoding a video unit of a video as a coded video unit, generating reconstructed samples from the coded video unit, and performing a clipping operation on the reconstructed samples. , the clipping parameter used in the clipping operation is a function of a clipping index and the bit depth of the reconstructed samples or the bit depth of the samples of the video unit; applying a nonlinear adaptive loop filter; and using the coded video units to generate a coded representation of the video.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、前記ビデオのビデオユニットを表す符号化ビデオユニットについてビデオのコード化表現を解析するステップと、前記符号化ビデオユニットから前記ビデオユニットの再構成サンプルを生成するステップと、前記再構成サンプルに対してクリッピング動作を実行するステップであり、前記クリッピング動作で使用されるクリッピングパラメータは、クリッピングインデックス、および、前記再構成サンプルのビット深度または前記ビデオユニットのビット深度に係る関数である、ステップと、最終的な復号ビデオユニットを生成するように、前記クリッピング動作の出力に対して非線形適応ループフィルタを適用するステップと、を含む。 In another aspect, the disclosed technology can be used to provide a video processing method. The method comprises the steps of: analyzing a coded representation of a video for coded video units representing video units of the video; generating reconstructed samples of the video units from the coded video units; wherein the clipping parameter used in the clipping operation is a function of the clipping index and the bit depth of the reconstructed samples or the bit depth of the video unit; . applying a non-linear adaptive loop filter to the output of said clipping operation to produce a final decoded video unit.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、1つ以上のビデオ領域を含むビデオのコード化表現と、前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップと、を含む。そして、ここで、前記決定は、前記ビデオ、及び/又は、前記ビデオ領域、及び/又は、前記ビデオユニットのコード化情報に基づいている。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes the steps of performing a transform between a coded representation of a video including one or more video regions and said video, and using a non-linear adaptive loop filter to reconstruct video units of the video region. determining clipping parameters for filtering. And wherein said determination is based on coding information of said video and/or said video region and/or said video unit.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、1つ以上のビデオ領域を含むビデオのコード化表現と、前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップと、を含む。そして、ここで、前記クリッピングパラメータは、色表現フォーマットの関数である。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes the steps of performing a transform between a coded representation of a video including one or more video regions and said video, and using a non-linear adaptive loop filter to reconstruct video units of the video region. determining clipping parameters for filtering. and wherein said clipping parameter is a function of the color representation format.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、1つ以上のビデオ領域を含むビデオのコード化表現と、前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップと、を含む。そして、ここで、前記クリッピングパラメータは、第1ドメインおよび第2ドメインにおけるビデオユニットの表現、及び/又は、クロマビデオユニットのクロマ残余のスケーリングに基づいて、前記ビデオユニットを再構成するためにループ内再形成(ILR)が適用されるか否かに依存する。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes the steps of performing a transform between a coded representation of a video including one or more video regions and said video, and using a non-linear adaptive loop filter to reconstruct video units of the video region. determining clipping parameters for filtering. and wherein the clipping parameters are in-loop to reconstruct the video unit based on representations of the video unit in the first domain and the second domain and/or scaling of chroma residuals of the chroma video unit. Depending on whether reshaping (ILR) is applied or not.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、この方法は、1つ以上のビデオ領域を含むビデオのコード化表現とビデオとの間の変換を実行することを含む。ここで、前記コード化表現は、非線形適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する第1側面情報を含む。ここで、前記第1側面情報は、前記非線形適応ループフィルタにおいて使用されるフィルタ係数を示している第2側面情報と共に信号化される。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes performing a conversion between the video and a coded representation of the video that includes one or more video regions. Here, said coded representation includes first side information providing clipping parameters for filtering reconstructions of video units in the video domain using a non-linear adaptive loop filter. Here, said first flank information is signaled together with second flank information indicating filter coefficients used in said non-linear adaptive loop filter.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、1つ以上のビデオ領域を含むビデオのコード化表現とビデオとの間で変換を実行することを含む。ここで、コード化表現は、非線形適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータの複数のセットを示す、側面情報を含む。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes performing a transform between the video and a coded representation of the video that includes one or more video regions. Here, the coded representation includes side information indicating multiple sets of clipping parameters for filtering reconstructions of video units in the video domain using a non-linear adaptive loop filter.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、1つ以上のビデオ領域を含むビデオのコード化表現とビデオとの間の変換を実行することを含む。ここで、前記コード化表現は、非線形適応ループフィルタを使用してビデオ領域のクロマビデオユニットの再構成をフィルタリングするための1つ以上のクリッピングパラメータを提供するサイド情報を含む。ここで、前記1つ以上のクリッピングパラメータはカラーフォーマットに依存している。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes performing a conversion between the video and a coded representation of the video that includes one or more video regions. Here, said coded representation includes side information providing one or more clipping parameters for filtering reconstruction of chroma video units in the video domain using a non-linear adaptive loop filter. Here, the one or more clipping parameters are color format dependent.

別の態様において、開示される技術は、ビデオ処理方法を提供するために使用され得る。この方法は、、1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間で変換を実行することを含む。ここで、前記コード化表現は、適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する側面情報を含む。ここで、前記実行することは、ビデオ領域レベルでの差異をサンプリングするためにクリッピング動作を適用することによってフィルタリングされたビデオユニットを生成することを含む。 In another aspect, the disclosed technology can be used to provide a video processing method. The method includes performing a transform between a coded representation of a video including one or more video regions and said video. Here, said coded representation includes side information providing clipping parameters for filtering reconstruction of video units of the video domain using an adaptive loop filter. Here, the performing includes generating filtered video units by applying a clipping operation to sample differences at the video domain level.

さらに別の代表的な態様において、上述の方法は、プロセッサ実行可能コードの形態で具体化され、かつ、コンピュータ読取り可能プログラム媒体に保管される。 In yet another exemplary aspect, the method described above is embodied in the form of processor-executable code and stored on a computer-readable program medium.

さらに別の代表的な態様においては、上述の方法を実行するように構成され、または、動作可能な装置が開示される。本装置は、この方法を実装するようにプログラムされたプロセッサを含み得る。 In yet another exemplary aspect, an apparatus configured or operable to perform the above method is disclosed. The apparatus may include a processor programmed to implement this method.

さらに別の代表的な態様において、上記に開示された方法の1つ以上は、エンコーダ側の実装またはデコーダ側の実装であり得る。 In yet another representative aspect, one or more of the methods disclosed above may be encoder-side implementations or decoder-side implementations.

開示される技術の上記の態様および特徴は、図面、明細書、および請求項において、より詳細に記載されている。 The above aspects and features of the disclosed technology are described in more detail in the drawings, specification and claims.

図1は、一つの例示的なビデオコーディングのためのエンコーダブロック図を示している。FIG. 1 shows an encoder block diagram for one exemplary video coding . 図2Aは、幾何学的変換に基づく適応ループフィルタ(geometry transformation-based adaptive loop filter、GALF)のフィルタ形状の例を示している。FIG. 2A shows an example filter shape for a geometry transformation-based adaptive loop filter (GALF). 図2Bは、幾何学的変換に基づく適応ループフィルタ(GALF)のフィルタ形状の例を示している。FIG. 2B shows an example filter shape for a geometric transform-based adaptive loop filter (GALF). 図2Cは、幾何学的変換に基づく適応ループフィルタ(GALF)のフィルタ形状の例を示している。FIG. 2C shows an example filter shape for a geometric transform-based adaptive loop filter (GALF). 図3は、一つの例示的なGALFエンコーダ決定のためのフローチャートを示している。FIG. 3 shows a flowchart for one exemplary GALF encoder determination. 図4Aは、適応ループフィルタ(adaptive loop filter、ALF)分類のためのサブサンプリングされたラプラシアン(Laplacian)計算の例を示している。FIG. 4A shows an example of a subsampled Laplacian computation for adaptive loop filter (ALF) classification. 図4Bは、適応ループフィルタ分類のためのサブサンプリングされたラプラシアン計算の例を示している。FIG. 4B shows an example of subsampled Laplacian computation for adaptive loop filter classification. 図4Cは、適応ループフィルタ分類のためのサブサンプリングされたラプラシアン計算の例を示している。FIG. 4C shows an example of subsampled Laplacian computation for adaptive loop filter classification. 図4Dは、適応ループフィルタ分類のためのサブサンプリングされたラプラシアン計算の例を示している。FIG. 4D shows an example of subsampled Laplacian computation for adaptive loop filter classification. 図5は、一つの例示的なルマ(luma)フィルタ形状を示している。FIG. 5 shows one exemplary luma filter shape. 図6は、一つの例示的なワイドビデオグラフィックアレイ(Wide Video Graphic Array、WVGA)シーケンスの領域分割を示している。FIG. 6 shows the segmentation of one exemplary Wide Video Graphic Array (WVGA) sequence. 図7は、一つの例示的な再形成(reshaping)を伴うフローの復号化のフローチャートを示している。FIG. 7 shows a flowchart of flow decoding with one exemplary reshaping. 図8Aは、開示される技術のいくつかの実装に従った、ビデオ処理のための例示的な方法のフローチャートを示している。FIG. 8A shows a flowchart of an exemplary method for video processing, according to some implementations of the disclosed technology. 図8Bは、開示される技術のいくつかの実装に従った、ビデオ処理のための例示的な方法のフローチャートを示している。FIG. 8B shows a flowchart of an exemplary method for video processing, in accordance with some implementations of the disclosed technology. 図8Cは、開示される技術のいくつかの実装に従った、ビデオ処理のための例示的な方法のフローチャートを示している。FIG. 8C shows a flowchart of an exemplary method for video processing, in accordance with some implementations of the disclosed technology. 図9は、開示される技術のいくつかの実装に従った、ビデオ処理のための例示的な方法のフローチャートを示している。FIG. 9 shows a flowchart of an exemplary method for video processing, in accordance with some implementations of the disclosed technology. 図10Aは、本開示において説明されるビデオ処理技術を実装するためのハードウェアプラットフォームの例示的なブロック図である。FIG. 10A is an exemplary block diagram of a hardware platform for implementing the video processing techniques described in this disclosure. 図10Bは、本開示において説明されるビデオ処理技術を実装するためのハードウェアプラットフォームの例示的なブロック図である。FIG. 10B is an exemplary block diagram of a hardware platform for implementing the video processing techniques described in this disclosure.

より高解像度のビデオに対する要求が高まっているため、ビデオコーディング(video coding)方法および技術は、現代の技術においてユビキタス(ubiquitous)なものである。ビデオコーデック(video codec)は、典型的に、デジタルビデオを圧縮または解凍する電子回路またはソフトウェアを含み、そして、より高いコード化効率を提供するために継続的に改良されている。ビデオコーデックは、圧縮されていないビデオを圧縮形式に変換し、または、その逆も同様である。ビデオ品質、ビデオを表現するために使用されるデータ量(ビットレート(bit rate)によって決定される)、符号化および復号化アルゴリズムの複雑性、データ損失およびエラーに対するセンシティビティ、編集の容易さ、ランダムアクセス、および、エンドツーエンド遅延(レイテンシ(latency))の間には、複雑な関係性が存在している。圧縮フォーマットは、たいてい、標準的なビデオ圧縮仕様、例えば、高効率ビデオコーディング(HEVS)標準(H.265またはMPEG-H Part2としても知られている)、最終化されるバーサタイルビデオコーディング(VVC)標準、または、他の現在及び/又は将来のビデオコーディング標準に準拠している。 Due to the increasing demand for higher resolution video, video coding methods and techniques are ubiquitous in modern technology. Video codecs typically include electronic circuitry or software that compresses or decompresses digital video, and are continually being improved to provide greater coding efficiency . A video codec converts uncompressed video into compressed form or vice versa. video quality, amount of data used to represent the video (determined by bit rate), complexity of encoding and decoding algorithms, sensitivity to data loss and errors, ease of editing, A complex relationship exists between random access and end-to-end delay (latency). Compression formats are often standard video compression specifications, such as the High Efficiency Video Coding (HEVS) standard (also known as H.265 or MPEG-H Part 2), Versatile Video Coding (VVC) to be finalized. standards, or other current and/or future video coding standards.

いくつかの実施態様においては、Joint Exploration Model(JEM)として知られる参照ソフトウェアを用いて、将来のビデオコーディング技術が探索されている。JEMでは、サブブロックベースの予測が、いくつかのコード化ツールに採用されている。アフィン予測、代替時間的動きベクトル予測(alternative temporal motion vector prediction、ATMVP)、空間時間的動きベクトル予測(spatial-temporal motion vector prediction、STMVP)、双方向光学フロー(bi-directional optical flow、BIO)、フレームレートアップ変換(FRUC)、ローカル適応動きベクトル解像度(Locally Adaptive Motion Vector Resolution、LAMVR)、オーバーラップブロック運動補償(Overlapped Block Motion Compensation、OBMC)、局所照明補償(Local Illumination Compensation、LIC)、および、デコーダ側動きベクトル精緻化(Decoder-side Motion Vector Refinement、DMVR)といったものである。 In some embodiments, future video coding techniques are explored using reference software known as the Joint Exploration Model (JEM). In JEM, sub-block-based prediction is employed in several coding tools . Affine prediction, alternative temporal motion vector prediction (ATMVP), spatial-temporal motion vector prediction (STMVP), bi-directional optical flow (BIO), Frame Rate Up Conversion (FRUC), Locally Adaptive Motion Vector Resolution (LAMVR), Overlapped Block Motion Compensation (OBMC), Local Illumination Compensation (LIC), and Such as Decoder-side Motion Vector Refinement (DMVR).

開示される技術の実施形態は、ランタイム性能を改善するために、既存のビデオコーディング標準(例えば、HEVC、H.265)、および、将来の標準に対して適用され得る。本文書では、説明の可読性を向上させるためにセクション見出しを使用しており、そして、いかなる場合も、説明または実施形態(及び/又は、実装)を各セクションのみに限定するものではない。 Embodiments of the disclosed techniques can be applied to existing video coding standards (eg, HEVC, H.265) and future standards to improve runtime performance. Section headings are used in this document to improve the readability of the description, and in no way limit the description or embodiments (and/or implementations) to individual sections only.

1 色空間およびクロマサブサンプリングの例
色空間(color space)、カラーモデル(または、カラーシステム)としても知られているものは、色の範囲を数字のタプル(tuple)として、典型的には、3個または4個の値、もしくは、色成分(例えば、RGB)として、簡単に記述する抽象的な数学モデルである。基本的に言えば、色空間は、座標系とサブ空間の精緻化(elaboration)である。
1 Examples of color spaces and chroma subsampling A color space, also known as a color model (or color system), defines a range of colors as a tuple of numbers, typically An abstract mathematical model that can be simply described as 3 or 4 values or color components (eg, RGB). Basically speaking, a color space is an elaboration of coordinate systems and subspaces.

ビデオ圧縮について、最も頻繁に使用される色空間は、YCbCrおよびRGBである。 For video compression, the most frequently used color spaces are YCbCr and RGB.

YCbCr、Y'CbCr、または、Y Pb/Cb Pr/Cr、YCBCRまたはY'CBCRとしても記載されるものは、ビデオおよびデジタル写真システムにおけるカラー画像パイプラインの一部として使用される色空間のファミリーである。Y’はルマ成分(luma component)であり、そして、CBおよびCRは、青色差(blue-difference)および赤色差(red-difference)クロマ(chroma)成分である。Y’(プライムあり)は、ルミナンス(luminance)であるYと区別されており、これは、光強度(light intensity)が、ガンマ補正RGB原色(gamma corrected RGB primaries)に基づいて非線形に符号化されることを意味している。 YCbCr, Y'CbCr, also referred to as Y Pb/Cb Pr/Cr, YCBCR or Y'CBCR, is a family of color spaces used as part of color image pipelines in video and digital photography systems is. Y' is the luma component, and CB and CR are the blue-difference and red-difference chroma components. Y' (primed) is distinguished from Y, which is the luminance, where light intensity is non-linearly encoded based on gamma corrected RGB primaries. means that

クロマサブサンプリング(chroma subsampling)は、ルミナンスよりも色の違いについてヒトの視覚系の視力が低いことを利用して、ルミナンス情報よりもクロマ情報についてより低い解像度を実装することによる、画像を符号化する実践である。 Chroma subsampling takes advantage of the human visual system's lower acuity for color differences than for luminance and encodes images by implementing a lower resolution for chroma information than for luminance information. It is a practice to do.

1.1 4:4:4カラーフォーマット
3個のY'CbCr成分それぞれは、同じサンプルレートを有するので、クロマサブサンプリングは存在しない。このスキームは、ときどき、ハイエンドのフィルムスキャナおよび映画のポストプロダクションにおいて使用されている。
1.1 4:4:4 color format
Since each of the three Y'CbCr components have the same sample rate, there is no chroma subsampling. This scheme is sometimes used in high-end film scanners and movie post-production.

1.2 4:2:2カラーフォーマット
2個のクロマ成分はルマのサンプルレートの半分でサンプリングされる。例えば、水平クロマ解像度が半分になる。このことは、視覚的な差異がほとんどないか全くない状態で非圧縮ビデオ信号の帯域幅を3分の1に低減する。
1.2 4:2:2 color format
The two chroma components are sampled at half the luma sample rate. For example, horizontal chroma resolution is halved. This reduces the bandwidth of the uncompressed video signal by a factor of three with little or no visual difference.

1.3 4:2:0カラーフォーマット
4:2:0において、水平方向のサンプリングは4:1:1に比べて2倍になるが、このスキームにおいてはCbおよびCrチャンネルが各代替ラインでのみサンプリングされるため、垂直方向の解像度は半分になる。従って、データレートは同じである。CbとCrは、それぞれ水平方向と垂直方向の2倍でサブサンプリングされる。4:2:0スキームの3つのバリエーションが存在し、異なる水平および垂直位置(sitting)を有している。
1.3 4:2:0 color format
At 4:2:0, the horizontal sampling is doubled compared to 4:1:1, but the vertical resolution is only be halved. Therefore, the data rates are the same. Cb and Cr are subsampled by a factor of two horizontally and vertically, respectively. There are three variations of the 4:2:0 scheme, with different horizontal and vertical sittings.

- MPEG-2においては、CbおよびCrは、共に配置(cosited)されている。CbおよびCrは、垂直方向のピクセル間に位置する(隙間(interstitially)に置かれている)。 - In MPEG-2, Cb and Cr are cosited. Cb and Cr are located (interstitially placed) between pixels in the vertical direction.

- JPEG/JFIF、H.261、およびMPEG-1において、CbおよびCrは、交互の(alternate)ルマサンプルの中間で隙間に配置されている。 - In JPEG/JFIF, H.261 and MPEG-1, Cb and Cr are spaced in the middle of alternate luma samples.

- 4:2:0 DVにおいて、CbおよびCrは、水平方向に共に配置されている。垂直方向において、それらは交互の線上に共に配置されている。 - In 4:2:0 DV, Cb and Cr are co-located horizontally. In the vertical direction they are arranged together on alternating lines.

2 典型的なビデオコーデックのコード化フローの例
図1は、一つの例示的なVCのCエンコーダブロック図を示している。図1に示されるように、ビデオエンコーディングのフローは、イントラ予測、及び/又は、動き推定/動き補償(motion estimation/motion compensation、ME/MC)を受ける、入力ビデオを用いて開始し得る。これらの動作(operation)は、ビデオの以前にコード化された部分の再構成されたコピーからのフィードバックを使用する。イントラ予測及び/又はME/MCの出力は、変換演算(T)を通じて差動的に処理され、量子化動作(Q)が後に続き、出力コード化表現へとエントロピー符号化(entropy coded)される。フィードバックループにおいて、コード化表現(Qブロックの出力)は、逆量子化演算(IQ)、続いて逆変換演算を経て、符号化されたビデオブロックの再構成サンプルを生成することができる。
2 Example of Encoding Flow of a Typical Video Codec Figure 1 shows a C encoder block diagram of one exemplary VC. As shown in FIG. 1, the video encoding flow may begin with input video undergoing intra-prediction and/or motion estimation/motion compensation (ME/MC). These operations use feedback from reconstructed copies of previously encoded portions of the video. The output of intra prediction and/or ME/MC is differentially processed through a transform operation (T), followed by a quantization operation (Q), and entropy coded into an output coded representation. . In a feedback loop, the coded representation (the output of the Q block) can undergo an inverse quantization operation (IQ) followed by an inverse transform operation to produce reconstructed samples of the coded video block.

再構成されたサンプルは、さらに、参照サンプル、または、参照ブロック、もしくは、さらなる符号化のために使用される参照画像を生成するために、種々の「ループ内(“in loop”)」フィルタリング動作を通して処理され得る。ループ内フィルタリングプロセスチェーンは、3つのループ内フィルタリングブロック、即ち、デブロッキングフィルタ(DF)、サンプル適応オフセット(SAO)、およびALFを含む。予め定義されたフィルタを使用する、DFとは異なり、SAOおよびALFは、オフセットおよびフィルタ係数を信号化しているコード化された側面情報(side information)を用いて、オフセットを追加し、かつ、有限インパルス応答(finite impulse response、FIR)フィルタをそれぞれ適用することによって、元のサンプルと再構成されたサンプルとの間の平均二乗誤差を減少させるために、現在画像の元のサンプルを使用する。ALFは、各画像の最終処理ステージに配置されており、そして、以前のステージで生成されたアーチファクトを捕捉し、かつ、修復しようとするツールとして見なすことができる。 The reconstructed samples are then subjected to various "in loop" filtering operations to generate reference samples, or reference blocks, or reference images that are used for further encoding. can be processed through The in-loop filtering process chain includes three in-loop filtering blocks: deblocking filter (DF), sample adaptive offset (SAO), and ALF. Unlike DF, which uses predefined filters, SAO and ALF add offset and finite The original samples of the current image are used to reduce the mean squared error between the original and reconstructed samples by applying finite impulse response (FIR) filters respectively. ALF is placed in the final processing stage of each image and can be viewed as a tool that attempts to capture and repair artifacts produced in previous stages.

デコーダ側では、復号され、かつ、再構成されたビデオサンプルを生成するために、符号化動作のうちいくつかが逆の順序で実行される。例えば、図1を参照すると、デコーダは、エントロピー符号化の出力であるコード化表現を解析し、かつ、ビデオの符号化ユニットまたはブロックを取得する。これらは、次いで、ビデオユニットの再構成サンプルを生成するために、逆量子化演算(IQ)および逆変換演算を(IT)通過する。最終的な復号されたビデオユニットは、ビデオエンコーダのフィードバックループに関して上述したようなループ内フィルタリング動作を適用することによって生成され得る。 At the decoder side, some of the encoding operations are performed in reverse order to produce decoded and reconstructed video samples. For example, referring to FIG. 1, a decoder parses a coded representation, which is the output of entropy coding, and obtains coded units or blocks of video. These then pass through an inverse quantization operation (IQ) and an inverse transform operation (IT) to produce reconstructed samples of the video unit. The final decoded video unit may be produced by applying an in-loop filtering operation as described above with respect to the feedback loop of the video encoder.

3 JEMにおける幾何学的変換ベースの適応ループフィルタの例
JEMでは、ブロックベースフィルタ適応を有する幾何学的変換ベースの適応ループフィルタ(GALF)が適用される。ルマ成分では、ローカルグラデーションの方向とアクティビティに基づいて、2×2ブロックごとに25個のフィルタのうちの1つが選択される。
3 Examples of geometric transformation-based adaptive loop filters in JEM
In JEM, a geometric transformation-based adaptive loop filter (GALF) with block-based filter adaptation is applied. For the luma component, one of 25 filters is selected per 2x2 block based on local gradient direction and activity.

3.1 フィルタ形状の例
JEMでは、ルマ成分に対して、最大3個のダイヤモンドフィルタ形状を(5×5ダイヤモンド、7×7ダイヤモンド、および9×9ダイヤモンドについて、それぞれ図2A、2B、および2Cに示されるように)選択することができる。インデックスは、ルマ成分について使用されるフィルタの形状を示すために、画像レベルで信号化される。画像におけるクロマ成分については、5×5のダイヤモンド形状が常に使用される。
3.1 Examples of filter shapes
JEM selects up to three diamond filter shapes (as shown in Figures 2A, 2B, and 2C for 5x5 diamond, 7x7 diamond, and 9x9 diamond, respectively) for the luma component. can do. The index is signaled at the image level to indicate the shape of the filter used for the luma component. For chroma components in images, a 5x5 diamond shape is always used.

3.1.1 ブロック分類
各ブロックは、25個のクラスのうち1つへと分類される。分類インデックスCは、その方向性(directionality)Dと活動の量子化値A^に基づいて、次のように導出される。
C=5D+A^ (1)
DおよびA^を計算するために、水平方向、垂直方向、および2つの対角方向の勾配(gradients)が、1-Dラプラシアン(Laplacian)使用して、まず、計算される。

Figure 2020192644000001
(2)
Figure 2020192644000002
(3)
Figure 2020192644000003
(4)
Figure 2020192644000004
(5)
インデックスiおよびjは2×2ブロック内の左上のサンプルの座標を指し、そして、r(i,j)は座標(I,j)における再構成されたサンプルを示している。
次に、水平方向と垂直方向の勾配の最大値と最小値Dが次のように設定される。
h,v max=max(gh,gv)、gh,v min=min(gh,gv) (6)
そして、2つの対角方向の勾配の最大値と最小値が次のように設定される。
d0,d1 max=max(gd0,gd1)、gd0,d1 min=min(gd0,gd1) (7)
方向性Dの値を導出するために、これらの値が相互に、および、2個の閾値t1およびt2を用いて比較される。
ステップ1.gh,v max≦t1・gh,v min、かつ、gd0,d1 max≦t1・gd0,d1 minが真である場合に、Dは0に設定される。
ステップ2.gh,v max/gh,v min>gd0,d1 max/gd0,d1 minである場合には、ステップ3から継続し、そうでなければ、ステップ4から継続する。
ステップ3.gh,v max>t2・gh,v minである場合に、Dは2に設定され、そうでなければ、Dは1に設定される。
ステップ4.gd0,d1 max>t2・gd0,d1 minである場合に、Dは4に設定され、そうでなければ、Dは3に設定される。活性値(activity value)Aは、次のように計算される。
Figure 2020192644000005
(8)
Aは、包括的に、さらに0から4の範囲に量子化され、そして、量子化された値はA^として示される。画像内の両方のクロマ成分について、分類方法は適用されない。すなわち、各クロマ成分に対してALF係数の単一セットが適用される。 3.1.1 Block classification Each block is classified into one of 25 classes. A classification index C is derived based on its directionality D and the quantized value A of the activity as follows.
C=5D+A^ (1)
To compute D and A, the horizontal, vertical and two diagonal gradients are first computed using the 1-D Laplacian.
Figure 2020192644000001
(2)
Figure 2020192644000002
(3)
Figure 2020192644000003
(4)
Figure 2020192644000004
(5)
Indices i and j refer to the coordinates of the upper left sample in the 2x2 block, and r(i,j) denotes the reconstructed sample at coordinates (I,j).
Next, the maximum and minimum horizontal and vertical gradients D are set as follows:
g h,v max =max(g h ,g v ),g h,v min =min(g h ,g v ) (6)
Then the maximum and minimum values of the two diagonal gradients are set as follows:
g d0,d1 max =max(g d0 ,g d1 ),g d0,d1 min =min(g d0 ,g d1 ) (7)
To derive the value of directionality D, these values are compared with each other and with two thresholds t 1 and t 2 .
Step 1. D is set to 0 if g h,v max ≦t 1 ·g h,v min and g d0,d1 max ≦t 1 ·g d0,d1 min is true.
Step 2. If g h,v max /g h,v min >g d0,d1 max /g d0,d1 min then continue from step 3, otherwise continue from step 4.
Step 3. If g h,v max >t 2 ·g h,v min then D is set to 2, otherwise D is set to 1.
Step 4. If g d0,d1 max >t 2 ·g d0,d1 min then D is set to 4, otherwise D is set to 3. The activity value A is calculated as follows.
Figure 2020192644000005
(8)
A is further quantized to the range 0 to 4, inclusive, and the quantized value is denoted as A^. No classification method is applied for both chroma components in the image. That is, a single set of ALF coefficients is applied to each chroma component.

3.1.2 フィルタ係数の幾何学的変換
各2×2ブロックをフィルタリングする前に、そのブロックについて計算された勾配値に応じて、回転、または、対角および垂直フリッピング(flipping)といった幾何学的変換が、フィルタ係数f(k,l)に対して適用される。これは、フィルタ支持領域(support region)内のサンプルに対してこれらの変換を適用することと等価である。このアイデアは、ALFが適用される異なるブロックを、それらの方向性を整列させることによって、より類似させることである。
3.1.2 Geometric transformations of filter coefficients Before filtering each 2x2 block, geometric transformations such as rotation or diagonal and vertical flipping, depending on the gradient values computed for that block. is applied to the filter coefficients f(k,l). This is equivalent to applying these transforms to the samples within the filter support region. The idea is to make the different blocks to which ALF is applied more similar by aligning their orientation.

対角、垂直フリップ、および回転を含む3つの幾何学的変換が導入される。
対角線(Diagonal) :fD(k,l)=f(l,k)、
垂直反転(Vertical flip):fV(k,l)=f(k,K-l-1)、
回転(Rotation) :fR(k,l)=f(K-l-,k)
(9)
Three geometric transformations are introduced, including diagonal, vertical flip, and rotation.
Diagonal : f D (k,l)=f(l,k),
Vertical flip: fV (k,l)=f(k,Kl-1),
Rotation: f R (k,l)=f(Kl-,k)
(9)

ここでは、位置(0,0)が左上隅にあり、かつ、位置(K-1,K-1)が右下隅にあるように、Kはフィルタのサイズであり、そして、0≦k、l≦K-1は係数座標である。変換は、そのブロックについて計算された勾配値に依存して、フィルタ係数f(k,l)に対して適用される。変換と4方向の4個の勾配の関係が表1にまとめられている。

Figure 2020192644000006
表1:1ブロックについて計算された勾配のマッピングおよび変換 where K is the size of the filter such that position (0,0) is in the upper left corner and position (K-1,K-1) is in the lower right corner, and 0≤k, l ≤K-1 is the coefficient coordinate. A transform is applied to the filter coefficients f(k,l) depending on the gradient values computed for that block. The relationship between the transform and the four gradients in the four directions is summarized in Table 1.
Figure 2020192644000006
Table 1: Gradient mapping and transformation computed for one block

3.1.3 フィルタパラメータのシグナル伝達
JEMにおいて、GALFフィルタパラメータは、第1CTU、すなわち、スライスヘッダの後で、かつ、第1CTUのSAOパラメータの前に信号化される。最大25セットのルマフィルタ係数がシグナル化され得る。ビットオーバーヘッドを低減するために、異なる分類のフィルタ係数をマージすることができる。また、参照画像のGALF係数が保管され、そして、現在画像のGALF係数として再利用される。現在画像は、参照画像のために保管されたGALF係数を使用し、GALF係数信号をバイパスすることを選択することができる。この場合、参照画像の1つへのインデックスのみが信号化され、示された参照画像の保管されたGALF係数が現在画像に対して継承される。
3.1.3 Signaling Filter Parameters
In JEM, the GALF filter parameters are signaled after the first CTU, ie the slice header, and before the SAO parameters of the first CTU. Up to 25 sets of luma filter coefficients can be signaled. To reduce bit overhead, different categories of filter coefficients can be merged. Also, the GALF coefficients of the reference image are saved and reused as the GALF coefficients of the current image. The current image can choose to use the GALF coefficients stored for the reference image and bypass the GALF coefficient signal. In this case only the index into one of the reference images is signaled and the stored GALF coefficients of the indicated reference image are inherited for the current image.

GALF時間的予測(temporal prediction)をサポートするために、GALFフィルタセットの候補リストが維持される。新しいシーケンスの複合の開始時に、候補リストは空である。1つの画像をデコードした後で、対応するフィルタのセットが候補リストに追加されてよい。候補リストのサイズが最大許容値(すなわち、現在のJEMでは6)に達すると、新しいフィルタのセットが復号順に最も古いセットを上書きする。っそいて、すなわち、先入れ先出し(FIFO)ルールが候補リストを更新するために適用される。重複を避けるために、対応するピクチャがGALF時間的予測を使用しない場合にのみ、セットをリストに追加できる。時間的スケーラビリティをサポートするために、フィルタセットの複数の候補リストが存在し、そして、各候補リストは時間的レイヤに関連付けられる。より具体的には、時間層インデックス(temporal layer index、TempIdx)によって割り当てられた各アレイは、より低いTempIdxと等しい以前に復号された画像のフィルタセットを構成することができる。例えば、k番目のアレイは、kに等しいTempIdxに関連付けられるように割り当てられ、そして、k以下のTempIdxを持つ画像からのフィルタセットのみを含む。所定のピクチャをコード化した後で、ピクチャに関連付けられたフィルタセットは、等しい又はより高いTempIdxに関連付けられたそれらのアレイを更新するために使用される。 A candidate list of GALF filter sets is maintained to support GALF temporal prediction. At the start of compositing a new sequence, the candidate list is empty. After decoding one image, a corresponding set of filters may be added to the candidate list. When the size of the candidate list reaches the maximum allowed value (ie 6 in the current JEM), the new set of filters overwrites the oldest set in decoding order. Thus, first-in-first-out (FIFO) rules are applied to update the candidate list. To avoid duplication, a set can be added to the list only if the corresponding picture does not use GALF temporal prediction. To support temporal scalability, there are multiple candidate lists of filter sets, and each candidate list is associated with a temporal layer. More specifically, each array assigned by temporal layer index (TempIdx) can constitute a filter set of previously decoded images equal to the lower TempIdx. For example, the kth array is assigned to be associated with TempIdx equal to k, and contains only filter sets from images with TempIdx less than or equal to k. After coding a given picture, the filter set associated with the picture is used to update those arrays associated with equal or higher TempIdx.

信号オーバヘッドを最小化するために、コード化フレーム間のためにGALF係数の時間的予測が使用される。イントラフレームについて、時間的予測は利用可能ではなく、そして、16個の固定フィルタのセットが各クラスに割り当てられる。固定フィルタの使用を示すために、各クラスに対するフラグが信号化され、そして、必要であれば、選択された固定フィルタのインデックスが示される。固定フィルタが与えられたクラスに対して選択された場合でも、適応フィルタf(k,l)の係数は、依然として、このクラスに対して送られ得る。この場合、再構成された画像に適用されるフィルタの係数は、係数の両方のセットの合計である。 Temporal prediction of GALF coefficients is used for inter- coded frames to minimize signaling overhead. For intra frames, temporal prediction is not available and a set of 16 fixed filters is assigned to each class. A flag for each class is signaled to indicate the use of a fixed filter and, if necessary, the index of the selected fixed filter. Even if a fixed filter is chosen for a given class, the coefficients of the adaptive filter f(k,l) can still be sent for this class. In this case, the coefficients of the filter applied to the reconstructed image are the sum of both sets of coefficients.

ルマ成分のフィルタリングプロセスは、CUレベルで制御できる。GALFがCUのルマ成分に適用されるか否かを示すためにフラグが信号化される。クロマ成分について、GALFが適用されるか否かは、画像レベルのみでしめされる。 The luma component filtering process can be controlled at the CU level. A flag is signaled to indicate whether GALF is applied to the luma component of the CU. For chroma components, whether or not GALF is applied is indicated only at the image level.

3.1.4 フィルタリングプロセス
デコーダ側では、ブロックについてGALFがイネーブル(enabled)されると、ブロック内の各サンプルR(i,j)がフィルタリングされ、以下に示されるようにサンプル値R’(i,j)を結果として生じる。ここで、Lはフィルタ長を表し、fm,nはフィルタ係数を表し、そして、f(k,l)は復号されたフィルタ係数を表す。

Figure 2020192644000007
(10) 3.1.4 Filtering Process At the decoder side, when GALF is enabled for a block, each sample R(i,j) in the block is filtered to obtain the sample value R'(i,j ) results. where L represents the filter length, f m,n represents the filter coefficients, and f(k,l) represents the decoded filter coefficients.
Figure 2020192644000007
(10)

3.1.5 エンコーダ側フィルタパラメータの決定プロセス
GALFについて全体的なエンコーダ決定プロセスが図3に示されている。各CUのルマサンプルについて、エンコーダは、GALFが適用されるか否かを決定し、そして、適切な信号フラグがスライスヘッダに含まれる。クロマサンプルについて、フィルタを適用するか否かの決定は、CUレベルではなく、画像レベルに基づいて行われる。さらに、画像のクロマGALFは、画像についてルマGALFがイネーブルされている場合にだけチェックされる。
3.1.5 Encoder-side filter parameter determination process
The overall encoder decision process for GALF is shown in FIG. For each CU luma sample, the encoder determines whether GALF is applied, and the appropriate signal flags are included in the slice header. For chroma samples, the decision to apply a filter or not is made based on the image level, not the CU level. Additionally, the chroma GALF of an image is checked only if luma GALF is enabled for the image.

4 VVCにおける幾何学的変換ベースの適応ループフィルタの例
VVCにおけるGALFの現在の設計は、JEMにおけるものと比較して、以下の主要な変化を有している。
1)適応フィルタの形状が除去される。ルマ成分については7×7のフィルタ形状だけが許可され、かつ、クロマ成分については5×5のフィルタ形状が許可される。
2)ALFパラメータの時間的予測および固定フィルタからの予測は、両方とも除去される。
3)各CTUに対して、ALFがイネーブルまたはディセーブルであろうとも、1ビットのフラグが信号化される。
4)分類インデックスの計算は、2×2ではなく、4×4レベルで行われる。加えて、JVET-L0147で提案されるように、ALF分類のためのサブサンプル・ラプラシアン計算法が利用される。より具体的には、1つのブロック内の各サンプルについて、水平/垂直/対角/135度勾配を計算する必要はない。代わりに、1:2サブサンプリングが利用される。
4 Examples of geometric transformation-based adaptive loop filters in VVC
The current design of GALF in VVC has the following major changes compared to that in JEM.
1) The shape of the adaptive filter is removed. Only a 7×7 filter shape is allowed for luma components, and a 5×5 filter shape is allowed for chroma components.
2) Both the temporal prediction of the ALF parameters and the prediction from the fixed filter are removed.
3) For each CTU, whether ALF is enabled or disabled, a 1-bit flag is signaled.
4) The calculation of the classification index is done on 4x4 levels instead of 2x2. In addition, as proposed in JVET-L0147, a sub-sampled Laplacian computational method for ALF classification is utilized. More specifically, there is no need to compute horizontal/vertical/diagonal/135 degree gradients for each sample in a block. Instead, 1:2 subsampling is used.

5 AVS2における領域ベースの適応ループフィルタの例
ALFは、ループ内フィルタリングの最終段階である。このプロセスには、2つの段階(stages)がある。第1段階はフィルタ係数の導出である。フィルタ係数を訓練(train)するために、エンコーダは、ルマ成分の再構成されたピクセルを16領域へと分類し、そして、1セットのフィルタ係数が、各カテゴリについて、ウィナー-ホップ(wiener-hopf)方程式を使用し訓練され、元のフレームと再構成されたフレームとの間の平均二乗誤差を最小化する。これら16セットのフィルタ係数の間の冗長性を低減するために、エンコーダは、レート歪み性能(rate-distortion performance)に基づいて、それらを適応的にマージする。最大で、ルマ成分について16個の異なるフィルタセットが割り当てられ、そして、クロマ成分については1個だけが割り当てられ得る。第2段階は、フレームレベルおよびLCUレベルの両方を含む、フィルタ決定である。最初に、エンコーダは、フレームレベル適応ループフィルタリングが実行されるか否かを決定する。フレームレベルALFがオンである場合には、エンコーダは、さらに、LCUレベルALFが実行されるか否かを決定する。
5 Example of a region-based adaptive loop filter in AVS2
ALF is the final stage of in-loop filtering. This process has two stages. The first step is the derivation of the filter coefficients. To train the filter coefficients, the encoder classifies the reconstructed pixels of the luma components into 16 regions, and a set of filter coefficients is generated by wiener-hopf ) equation to minimize the mean squared error between the original and reconstructed frames. To reduce the redundancy between these 16 sets of filter coefficients, the encoder adaptively merges them based on their rate-distortion performance. Up to 16 different filter sets can be assigned for the luma component and only one for the chroma component. The second stage is filter determination, which includes both frame level and LCU level. First, the encoder determines whether frame-level adaptive loop filtering is performed. If frame-level ALF is on, the encoder also determines whether LCU-level ALF is performed.

5.1 フィルタ形状
AVS-2で採用されるフィルタ形状は、ルマ成分とクロマ成分の両方について図5にちょうど示されるように、3×3の正方形を重ね合わせた7×7の十字形である。図5における各正方形は、サンプルに対応している。従って、位置C8のサンプルに対するフィルタ値を導出するために、合計17個のサンプルが使用される。係数を伝送するオーバヘッドを考慮して、点対称フィルタを、残された9個の係数{C0,C1,...,C8}だけに使用され、フィルタリングにおける乗算の数と同様に、フィルタ係数の数を半分まで削減する。点対称フィルタは、また、1つのフィルタリングされたサンプルに対する計算の半分を低減することができる。例えば、1つのフィルタリングされたサンプルについて9個の乗算および14個の加算だけである。
5.1 Filter shape
The filter shape employed in AVS-2 is a 7×7 cross with 3×3 squares superimposed, as just shown in FIG. 5 for both luma and chroma components. Each square in Figure 5 corresponds to a sample. Therefore, a total of 17 samples are used to derive the filter value for the sample at position C8. Considering the overhead of transmitting the coefficients, a point-symmetric filter is used for only the remaining 9 coefficients {C0,C1,...,C8}, and the number of multiplications in filtering as well as the number of filter coefficients Cut the number in half. A point-symmetric filter can also reduce the computation by half for one filtered sample. For example, only 9 multiplications and 14 additions for one filtered sample.

5.2 領域ベースの適応型マージ
異なるコード化誤差を適応させるために、AVS-2は、ルマ成分について領域ベースの複数適応ループフィルタを採用する。ルマ成分は、ほぼ等しいサイズの16個の基本領域に分割され、そこで、各基本領域は、図6に示されるように、最大コーディングユニット(largest coding unit、LCU)の境界と整列され、そして、各領域について1つのウィナーフィルタが導出される。より多くのフィルタを使用すると、より多くの歪みが低減されるが、これらの係数を符号化するために使用されるビットは、フィルタの数と共に増加する。最善のレート歪み性能を達成するために、これらの領域は、同じフィルタ係数を共有する、より少ない、より大きな領域へとマージすることができる。マージプロセスを単純化するために、画像の以前の相関に基づく修正ヒルベルト(Hilbert)順序に従って、各領域にインデックスを割り当てる。連続したインデックスを持つ2つの領域は、レート歪みコストに基づいてマージされ得る。
5.2 Region-based adaptive merging To accommodate different coding errors, AVS-2 employs region-based multiple adaptive loop filters for luma components. The luma component is divided into 16 elementary regions of approximately equal size, where each elementary region is aligned with the boundary of the largest coding unit (LCU), as shown in FIG. 6, and One Wiener filter is derived for each region. Using more filters reduces more distortion, but the bits used to encode these coefficients increase with the number of filters. To achieve the best rate-distortion performance, these regions can be merged into fewer, larger regions that share the same filter coefficients. To simplify the merging process, we assign an index to each region according to a modified Hilbert order based on previous correlations of the images. Two regions with consecutive indices may be merged based on rate-distortion cost.

領域間のマッピング情報はデコーダに対して信号化されるべきである。AVS-2では、基本領域の数がマージ結果を表すために使用され、そして、フィルタ係数は、その領域の順序に従って順次圧縮される。例えば、{0,1}、{2,3,4}、{5,6,7,8,9}、および左側の基本領域が、1つの領域へとそれぞれにマージされた場合、3つの整数だけがこのマージマップを表すようにコード化される。すなわち、2,3,5である。 Mapping information between regions should be signaled to the decoder. In AVS-2, the number of base regions is used to represent the merge result, and the filter coefficients are sequentially compressed according to the order of the regions. For example, if the {0,1}, {2,3,4}, {5,6,7,8,9}, and left elementary regions were each merged into one region, three integers is coded to represent this merge map. That is, 2,3,5.

5.3 サイド情報のシグナル伝達
複数のスイッチフラグも、また、使用される。シーケンススイッチフラグ、adptive_loop_filter_enableは、適応ループフィルタがシーケンス全体について適用されるか否かを制御するために使用される。画像スイッチフラグ、picture_alf_enble[i]は、対応するi番目の画像コンポーネントについてALFが適用されるか否かを制御する。picture_alf_enble[i]が有効になっている場合にのみ、対応するLCUレベルのフラグ、および、その色成分のフィルタ係数が送信される。LCUレベルフラグ、lcu_alf_enable[k]は、対応するk番目のLCUについてALFがイネーブルであるか否かを制御し、そして、スライスデータへとインタリーブされる。異なるレベルで調整されるフラグの決定は、全て、レート歪みコストに基づいている。さらに、高いフレキシビリティにより、ALFは、コード化効率を大幅に改善する。
5.3 Side Information Signaling Multiple switch flags are also used. A sequence switch flag, adaptive_loop_filter_enable, is used to control whether the adaptive loop filter is applied for the entire sequence. The picture switch flag, picture_alf_enble[i], controls whether ALF is applied for the corresponding i-th picture component. Only if picture_alf_enble[i] is enabled will the corresponding LCU level flags and filter coefficients for that color component be sent. The LCU level flag, lcu_alf_enable[k], controls whether ALF is enabled for the corresponding kth LCU and is interleaved into slice data. All flag decisions that are adjusted at different levels are based on the rate-distortion cost. Moreover, due to its high flexibility, ALF greatly improves coding efficiency .

いくつかの実施形態において、および、ルマ成分について、最大16セットのフィルタ係数が存在し得る。 In some embodiments, and for luma components, there may be up to 16 sets of filter coefficients.

いくつかの実施形態において、および、各クロマ成分(CbおよびCr)について、1セットのフィルタ係数が伝送され得る。 In some embodiments, and for each chroma component (Cb and Cr), one set of filter coefficients may be transmitted.

6 VTM-4におけるGALF
VTM4.0において、適応ループフィルタ(Adaptive Loop Filter)のフィルタリングプロセスは、以下のように実行される。

Figure 2020192644000008
(11) 6 GALF in VTM-4
In VTM 4.0, the filtering process of Adaptive Loop Filter is performed as follows.
Figure 2020192644000008
(11)

ここで、サンプルI(x+i,y+i)は入力サンプルであり、O(x,y)はフィルタリングされた出力サンプル(すなわち、フィルタ結果)であり、そして、w(i,j)はフィルタ係数を示している。実際に、VTM4.0では、固定小数点精度計算のために整数演算を使用して実装されている。

Figure 2020192644000009
(12) where sample I(x+i,y+i) is the input sample, O(x,y) is the filtered output sample (i.e. the filter result), and w(i,j) is It shows the filter coefficients. In fact, VTM 4.0 is implemented using integer arithmetic for fixed-point precision calculations.
Figure 2020192644000009
(12)

ここで、Lはフィルタ長を表し、そして、w(i,j)は固定小数点精度でのフィルタ係数である。 where L represents the filter length and w(i,j) are the filter coefficients in fixed-point precision.

7 非線形適応ループフィルタリング(ALF)
7.1 フィルタリング組成変更
式(11)は、コード化効率に影響を与えることなく、以下の式で組成変更され得る。

Figure 2020192644000010
(13) 7 Nonlinear Adaptive Loop Filtering (ALF)
7.1 Filtering Recomposition Equation (11) can be recomposed by the following equation without affecting coding efficiency.
Figure 2020192644000010
(13)

ここで、w(i,j)は、式(11)と同じフィルタ係数である[期待されるw(0,0)は式(13)における1に等しいが、一方で、式(11)における

Figure 2020192644000011
に等しい]。 where w(i,j) are the same filter coefficients as in equation (11) [expected w(0,0) equals 1 in equation (13), while
Figure 2020192644000011
be equivalent to].

7.2 修正フィルタ
上記のフィルタ等式(13)を使用して、ALFをより効率的にするために、非線形性を容易に導入することができる。簡単なクリッピング関数を使用することによるものであり、フィルタリングされる現在のサンプル値(I(x,y))とあまりにも異なる場合に、隣接サンプル値(I(x+i,y+i))の影響を低減する。
7.2 Correction Filter Using the filter equation (13) above, non-linearities can be easily introduced to make the ALF more efficient. By using a simple clipping function, the adjacent sample value (I(x+i,y+i)) if too different from the current sample value (I(x,y)) to be filtered reduce the impact of

本提案では、ALFフィルタが以下のように修正される。

Figure 2020192644000012
(14) In this proposal, the ALF filter is modified as follows.
Figure 2020192644000012
(14)

ここで、K(d,b)=min(b,max(-b,d))はクリッピング関数であり、そして、k(i,j)はクリッピングパラメータであり、(i,j)フィルタ係数に依存する。エンコーダは、最良のk(i,j)を見つけるために最適化を実行する。 where K(d,b)=min(b,max(-b,d)) is the clipping function, k(i,j) is the clipping parameter, and (i,j) is the filter coefficient Dependent. The encoder performs optimization to find the best k(i,j).

JVET-N0242実装では、各ALFフィルタについてクリッピングパラメータk(i,j)が指定され、フィルタ係数ごとに1つのクリッピング値が信号化される。これは、12個までのクリッピング値が、ルマフィルタごとにビットストリームで信号化され、かつ、クロマフィルタについて6個までのクリッピング値が信号化され得ることを意味する。 In the JVET-N0242 implementation, clipping parameters k(i,j) are specified for each ALF filter, and one clipping value is signaled per filter coefficient. This means that up to 12 clipping values can be signaled in the bitstream for each luma filter and up to 6 clipping values for the chroma filters.

信号化コストおよびエンコーダの複雑さを制限するために、筆者らはクリッピング値の評価を可能な値の小さなセットに制限した。提案では、インター(INTER)およびイントラ(INTRA)タイル群について同じである、4個の固定値のみを使用した。 To limit the signaling cost and encoder complexity, the authors restricted the clipping value evaluation to a small set of possible values. The proposal used only four fixed values, which are the same for INTER and INTRA tile groups.

ローカル差異(local differences)の分散は、しばしば、クロマよりも、ルマについて大きいので、ルマフィルタおよびクロマフィルタについて2個の異なるセットを使用する。また、各セットに最大サンプル値(ここでは、10ビットのビット深度(bit-depth)について1024)を含め、これにより、必要がなければ、クリッピングはディセーブルされ得る。 Since the variance of local differences is often larger for luma than for chroma, we use two different sets for luma and chroma filters. Also, each set includes the maximum sample value (here, 1024 for a bit-depth of 10 bits) so that clipping can be disabled if not needed.

JVET-N0242試験で使用されたクリッピング値のセットが表2で提供されている。4個の値は、対数領域において、ルマについてはサンプル値の全範囲(10ビットで符号化)、そして、クロマについては4から1024の範囲を、ほぼ等しく分割することによって選択されている。 A set of clipping values used in JVET-N0242 testing is provided in Table 2. The four values are chosen by approximately equally dividing the full range of sample values for luma (encoded in 10 bits) and the range 4 to 1024 for chroma in the logarithmic domain.

より正確には、クリッピング値のルマテーブルは、以下の等式によって獲得される。
AlfClipL=

Figure 2020192644000013
ここで、M=210、かつ、N=4 More precisely, the luma table of clipping values is obtained by the following equations.
AlfClip L =
Figure 2020192644000013
where M=2 10 and N=4

同様に、クリッピング値のクロマテーブルは、以下の等式に従って獲得される。
AlfClipL=

Figure 2020192644000014
ここで、M=210、N=4、かつ、A=4
Figure 2020192644000015
表2:許可されたクリッピング値 Similarly, a chroma table of clipping values is obtained according to the following equation.
AlfClip L =
Figure 2020192644000014
where M=2 10 , N=4 and A=4
Figure 2020192644000015
Table 2: Allowed Clipping Values

選択されたクリッピング値は、上記表2のクリッピング値のインデックスに対応するゴロム(Golomb)符号化スキームを使用することによって、“alf_data”シンタック要素でコード化される。この符号化スキームは、フィルタインデックスのための符号化方式と同一である。 The selected clipping value is encoded in the "alf_data" syntax element by using the Golomb encoding scheme corresponding to the clipping value index in Table 2 above. This encoding scheme is identical to the encoding scheme for the filter indices.

8 JVET-M0427におけるループ内再形成(ILR)
ループ内再形成(in-loop reshaping、ILR)は、クロマスケーリングによるルママッピング(Luma Mapping with Chroma Scaling、LMCS)としても知られている。
8 Intraloop Reformation (ILR) in JVET-M0427
In-loop reshaping (ILR) is also known as Luma Mapping with Chroma Scaling (LMCS).

ループ内再形成(ILR)の基本的なアイデアは、元の(第1ドメインの)信号(予測/再構成信号)を第2ドメイン(再形成ドメイン)に変換することである。 The basic idea of in-loop reconstruction (ILR) is to transform the original (first domain) signal (prediction/reconstruction signal) into the second domain (reconstruction domain).

ループ内ルマ再形成は、ルックアップテーブル(LUT)のペアとして実装されるが、他方は信号化されたLUTから計算できるので、2個のLUTのうちの1個だけが信号化される必要がある。各LUTは一次元、10ビット、1024エントリマッピングテーブル(1D-LUT)である。一方のLUTは、前方(forward)LUT、FwdLUT、であり、入力ルマコード値Yiを変更された値Yr、すなわちYr=FwdLUT[Yi]にマッピングする。他方のLUTは、逆LUT、InvLUTであり、変更されたコード値YrをYi^、すなわちYi^=InvLUT[Yr]にマッピングする。(Yi^は、Yiの再構成値を表している。) In-loop luma reconstruction is implemented as a pair of look-up tables (LUTs), but only one of the two LUTs needs to be signaled, since the other can be computed from the signaled LUT. be. Each LUT is a one-dimensional, 10-bit, 1024-entry mapping table (1D-LUT). One LUT, the forward LUT, FwdLUT, maps the input luma code value Yi to the modified value Yr, ie Yr=FwdLUT[Yi]. The other LUT is the inverse LUT, InvLUT, which maps the modified code values Yr to Yi^, ie Yi^=InvLUT[Yr]. (Yi^ represents the reconstructed value of Yi.)

8.1 PWLモデル
概念的には、区分ごとの(piece-wise)線形(PWL)は、以下のように実装される。
8.1 PWL Model Conceptually, the piece-wise linear (PWL) is implemented as follows.

x1、x2を2個の入力ピボット点とし、かつ、y1、y2を1個のピースについて対応する出力ピボット点とする。x1とx2との間の任意の入力値xに対する出力値yは、以下の等式によって補間され得る。
y=((y2-y1)/(x2-x1))*(x-x1)+y1
Let x1, x2 be the two input pivot points, and let y1, y2 be the corresponding output pivot points for a piece. The output value y for any input value x between x1 and x2 can be interpolated by the following equation.
y=((y2-y1)/(x2-x1))*(x-x1)+y1

固定小数点実装において、等式は、次のように書き換えることができる。
y=((m*x+2FP_PREC-1)>>FP_PREC)+c
In a fixed-point implementation, the equation can be rewritten as
y=((m*x+2FP_PREC-1)>>FP_PREC)+c

ここで、mはスカラー、cはオフセット、そして、FP_PRECは精度を指定するための定数値である。 where m is a scalar, c is an offset, and FP_PREC is a constant value specifying precision.

CE-12ソフトウェアにおいて、PWLモデルは1024エントリのFwdLUTおよびInvLUTマッピングテーブルを予め計算するために使用されるが、また、PWLモデルにより、LUTを予め計算することなく、実装がオンザフライで同一のマッピング値を計算することもできることに留意する。 In the CE-12 software, the PWL model is used to precompute the 1024-entry FwdLUT and InvLUT mapping tables, but the PWL model also allows the implementation to use the same mapping values on-the-fly without precomputing the LUTs. Note that we can also calculate

8.2 第4回VVC会議における試験CE12-2
8.2.1 ルマ再形成
ループ内ルマ再形成のテスト2(すなわち、提案におけるCE12-2)は、より複雑性の低いパイプラインを提供し、また、インタースライス再構成におけるブロックごとのイントラ予測のための復号化待ち時間(latency)も排除する。イントラ予測は、インタースライスおよびイントラスライスの両方について再形成ドメインにおいて実行される。
8.2 Test CE12-2 at the 4th VVC Conference
8.2.1 Luma Reconstruction Test 2 for in-loop luma reconstruction (i.e., CE12-2 in the proposal) provides a lower complexity pipeline and also for block-by-block intra prediction in inter-slice reconstruction. It also eliminates the decoding latency of Intra-prediction is performed in the reconstruction domain for both inter-slices and intra-slices.

イントラ予測は、スライスのタイプに関係なく、常に、再形成ドメインで実行される。そうした構成では、以前のTU再構成が行われた直後にイントラ予測を開始できる。そうした構成は、また、スライス依存である代わりに、イントラモードに対して統一されたプロセスを提供することもできる。図7は、モードに基づくCE12-2復号プロセスのブロック図を示している。 Intra-prediction is always performed in the reconstructed domain, regardless of the slice type. In such configurations, intra-prediction can start immediately after the previous TU reconstruction has taken place. Such a configuration can also provide a unified process for intra modes instead of being slice dependent. FIG. 7 shows a block diagram of the mode-based CE12-2 decoding process.

CE12-2は、また、CE12-1の32ピースPWLモデルの代わりに、ルマおよびクロマ残余(residue)スケーリングについて16ピースの区分ごとの線形(PWL)モデルも試験する。 CE12-2 also tests a 16-piece piecewise linear (PWL) model for luma and chroma residue scaling instead of the 32-piece PWL model of CE12-1.

CE12-2におけるループ内ルマ再形成を用いたインタースライス再構成である(明るい影付きのブロックは、再形成されたドメインにおける信号を示している。ルマ残余、イントラルマ予測、およびイントラルマ再構成である。) Inter-slice reconstruction with in-loop luma reconstruction in CE12-2 (light shaded blocks indicate signal in the reconstructed domain: luma residual, intra-luma prediction, and intra-luma reconstruction. .)

8.2.2 ルマ依存クロマ残余スケーリング
ルマ依存クロマ残余スケーリング(luma-dependent chroma residue scaling)は、固定小数点整数演算を用いて実装される乗法プロセスである。クロマ残余スケーリングは、クロマ信号とのルマ信号の相互作用を補償する。クロマ残余スケーリングはTUレベルで適用される。具体的には、以下の通りである。
-イントラについて、再構成ルマが平均化される。
-インターについて、予測ルマが平均化される。
8.2.2 Luma-Dependent Chroma Residual Scaling Luma-dependent chroma residue scaling is a multiplicative process implemented using fixed-point integer arithmetic. Chroma residual scaling compensates for the interaction of the luma signal with the chroma signal. Chroma residual scaling is applied at the TU level. Specifically, it is as follows.
- For intra, reconstructed lumas are averaged.
- For Inter, the predicted lumas are averaged.

平均値は、PWLモデルのインデックスを識別するために使用される。インデックスは、スケーリング係数cScaleInvを識別する。クロマ残余にその数を掛け算する。 The mean value is used to identify the index of the PWL model. The index identifies the scaling factor cScaleInv. Multiply the chroma residual by that number.

クロマスケーリング係数は、再構成されたルマ値ではなく、前方マップ(forward-mapped)で予測されたルマ値から計算されることに留意する。 Note that the chroma scaling factors are calculated from the forward-mapped predicted luma values, not the reconstructed luma values.

8.2.3 ILR側情報のシグナル伝達
パラメータは、(現在)タイル群ヘッダ(ALFと同様)において送信される。これらは40-100ビットを要すると言われている。以下の仕様は、JVET-L1001のバージョン9に基づいている。追加されたシンタックスは、イタリック体で以下に強調表示されている。

Figure 2020192644000016
Figure 2020192644000017
Figure 2020192644000018

一般シーケンスパラメータセットRBSPセマンティクス(General sequence parameter set RBSP semantics)において、以下のセマンティクスを追加する。
1に等しいsps_reshaper_enabled_flagは、コード化されたビデオシーケンス(CVS)においてリシェイパ(reshaper)が使用されることを指定する。
0に等しいsps_reshaper_enabled_flagは、CVSにおいてリシェイパが使用されないことを指定する。

タイル群・ヘッダシンタックス(tile group header syntax)において、以下のセマンティクスを追加する。
1に等しいtile_group_reshaper_model_present_flagは、tile_group_reshaper_model()がタイル群ヘッダ内に存在することを指定する。0に等しいtile_group_reshaper_model_present_flagは、tile_group_reshaper_model()がタイル群ヘッダ内に存在しないことを指定する。tile_group_reshaper_model_present_flagが存在しない場合は、0に等しいものと推定される。
1に等しいtile_group_reshaper_enabled_flagは、現在のタイル群についてリシェイパがイネーブルされていることを指定する。0に等しいtile_group_reshaper_enabled_flagは、現在のタイル群についてリシェイパがイネーブルされていないことを指定する。tile_group_resharper_enable_flagが存在しない場合は、0に等しいものと推定される。
1に等しいtile_group_reshaper_chroma_residual_scale_flagは、現在のタイル群についてクロマ残余スケーリングイネーブルされていることを指定する。0に等しいtile_group_reshaper_chroma_residual_scale_flagは、現在のタイル群でクロマ残余スケーリングがイネーブルされていないことを指定する。tile_group_reshaper_chroma_residual_scale_flagが存在しない場合は、0に等しいものと推定される。

tile_group_reshaper_model()シンタックスの追加
reshape_model_min_bin_idxは、リシェイパ構築プロセス(reshaper construction process)において使用される最小のビン(または、ピース)インデックスを指定する。reshape_model_min_bin_idxの値は、0からMaxBinIdxの範囲とする。MaxBinIdxの値は15に等しい。
reshape_model_delta_max_bin_idxは、リシェイパ構築プロセスにおいて使用される、最大許容ビン(または、ピース)であるインデックスMaxBinIdxから最大ビンインデックスを引いたものを指定する。reshape_model_max_bin_idxの値はMaxBinIdxマイナスreshape_model_delta_max_bin_idxに等しく設定される。
reshaper_model_bin_delta_abs_cw_pre_minus1プラス1は、シンタックスreshape_model_bin_delta_abs_CW[i]の表現について使用されるビット数を指定する。
reshape_model_bin_delta_abs_CW[i]は、i番目のビンについて絶対デルタコードワード値(absolute delta codeword value)を指定する。
reshaper_model_bin_delta_sign_CW_flag[i]は、reshape_model_bin_delta_abs_CW[i]の符号を以下のように指定する。
-reshape_model_bin_delta_sign_CW_flag[i]が0に等しい場合、対応する変数RspDeltaCW[i]は正の値である。
-それ以外の場合(reshape_model_bin_delta_sign_CW_flag[i]が0に等しくない)、対応する変数RspDeltaCW[i]は負の値である。

reshape_model_bin_delta_sign_CW_flag[i]が存在しない場合は、0に等しいものと推定される。

変数RspDeltaCW[i]=(1 2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i];

変数RspCW[i]は、以下のステップのように導出される。

変数OrgCWは、(1<<BitDepthY)/(MaxBinIdx+1)に等しく設定される。
-reshaper_model_min_bin_idx<=i<=reshaper_model_max_bin_idxの場合
RspCW[i]=OrgCW+RspDeltaCW[i]
-それ以外の場合、RspCW[i]=0

RspCW[i]の値は、BitDepthYの値が10に等しい場合、32から2×OrgCW-1の範囲である。

0からMaxBinIdx+1の範囲のiを持つ変数InputPivot[i]は、次のように導出される。
InputPivot[i]=i*OrgCW

0からMaxBinIdx+1の範囲のiを持つ変数ReshapePivot[i]と、0からMaxBinIdxの範囲のiを持つ変数ScaleCoef[i]およびInvScaleCoeff[i]は、次のように導出される。
shiftY=4
ReshapePivot[0]=0;
for(i=0;i<=MaxBinIdx;i++){
ReshapePivot[i+1]=ReshapePivot[i]+RspCW[i]
ScaleCoef[i]=(RspCW[i]*(1<<shiftY)+(1<<(Log2(OrgCW)-1)))>>(Log2(OrgCW))
if(RspCW[i]==0)
InvScaleCoeff[i]=0
else
InvScaleCoeff[i]=OrgCW*(1<<shiftY)/RspCW[i]
}

0からBinIdxの範囲のiを持つ変数ChromaScaleCoef[i]は、次のように導出される。
ChromaResidualScaleLut[64]={16384,16384,16384,16384,16384,16384,16384,8192,8192,8192,8192,5461,5461,5461,5461,4096,4096,4096,4096,3277,3277,3277,3277,2731,2731,2731,2731,2341,2341,2341,2048,2048,2048,1820,1820,1820,1638,1638,1638,1638,1489,1489,1489,1489,1365,1365,1365,1365,1260,1260,1260,1260,1170,1170,1170,1170,1092,1092,1092,1092,1024,1024,1024,1024};

shiftC=11
-if(RspCW[i]==0)
ChromaScaleCoef[i]=(1<<shiftC)
-Otherwise(RspCW[i]!=0),ChromaScaleCoef[i]=ChromaResidualScaleLut[RspCW[i]>>1]
8.2.3 Signaling ILR side information Parameters are (currently) sent in the tile group header (similar to ALF). These are said to require 40-100 bits. The following specifications are based on version 9 of JVET-L1001. The added syntax is highlighted below in italics.
Figure 2020192644000016
Figure 2020192644000017
Figure 2020192644000018

In the General sequence parameter set RBSP semantics, add the following semantics:
sps_reshaper_enabled_flag equal to 1 specifies that a reshaper is used in the coded video sequence (CVS).
sps_reshaper_enabled_flag equal to 0 specifies that reshaper is not used in CVS.

In the tile group header syntax, add the following semantics:
tile_group_reshaper_model_present_flag equal to 1 specifies that tile_group_reshaper_model( ) is present in the tile group header. tile_group_reshaper_model_present_flag equal to 0 specifies that tile_group_reshaper_model() is not present in the tile group header. If tile_group_reshaper_model_present_flag is not present, it is assumed to be equal to 0.
tile_group_reshaper_enabled_flag equal to 1 specifies that the reshaper is enabled for the current tile group. tile_group_reshaper_enabled_flag equal to 0 specifies that the reshaper is not enabled for the current tile group. If tile_group_resharper_enable_flag is not present, it is assumed to be equal to 0.
tile_group_reshaper_chroma_residual_scale_flag equal to 1 specifies that chroma residual scaling is enabled for the current tile group. tile_group_reshaper_chroma_residual_scale_flag equal to 0 specifies that chroma residual scaling is not enabled for the current tile group. If tile_group_reshaper_chroma_residual_scale_flag is not present, it is assumed to be equal to 0.

Added tile_group_reshaper_model() syntax
reshape_model_min_bin_idx specifies the minimum bin (or piece) index used in the reshaper construction process. The value of reshape_model_min_bin_idx shall be in the range from 0 to MaxBinIdx. The value of MaxBinIdx is equal to 15.
reshape_model_delta_max_bin_idx specifies the maximum allowed bin (or piece) index MaxBinIdx minus the maximum bin index to be used in the reshaper building process. The value of reshape_model_max_bin_idx is set equal to MaxBinIdx minus reshape_model_delta_max_bin_idx.
reshaper_model_bin_delta_abs_cw_pre_minus1 plus 1 specifies the number of bits used for representation in syntax reshape_model_bin_delta_abs_CW[i].
reshape_model_bin_delta_abs_CW[i] specifies the absolute delta codeword value for the i-th bin.
reshaper_model_bin_delta_sign_CW_flag[i] specifies the sign of reshape_model_bin_delta_abs_CW[i] as follows.
- if reshape_model_bin_delta_sign_CW_flag[i] is equal to 0, the corresponding variable RspDeltaCW[i] is positive.
- Otherwise (reshape_model_bin_delta_sign_CW_flag[i] is not equal to 0), the corresponding variable RspDeltaCW[i] is negative.

If reshape_model_bin_delta_sign_CW_flag[i] does not exist, it is assumed to be equal to 0.

Variable RspDeltaCW[i]=(1 2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i];

The variable RspCW[i] is derived as in the following steps.

The variable OrgCW is set equal to (1<<BitDepthY)/(MaxBinIdx+1).
- When reshaper_model_min_bin_idx<=i<=reshaper_model_max_bin_idx
RspCW[i]=OrgCW+RspDeltaCW[i]
- otherwise, RspCW[i]=0

The value of RspCW[i] ranges from 32 to 2*OrgCW-1 when the value of BitDepthY is equal to 10.

The variable InputPivot[i] with i in the range 0 to MaxBinIdx+1 is derived as follows.
InputPivot[i]=i*OrgCW

The variables ReshapePivot[i] with i in the range 0 to MaxBinIdx+1 and the variables ScaleCoef[i] and InvScaleCoeff[i] with i in the range 0 to MaxBinIdx are derived as follows.
shiftY=4
ReshapePivot[0]=0;
for(i=0;i<=MaxBinIdx;i++){
ReshapePivot[i+1]=ReshapePivot[i]+RspCW[i]
ScaleCoef[i]=(RspCW[i]*(1<<shiftY)+(1<<(Log2(OrgCW)-1)))>>(Log2(OrgCW))
if(RspCW[i]==0)
InvScaleCoeff[i]=0
else
InvScaleCoeff[i]=OrgCW*(1<<shiftY)/RspCW[i]
}

The variable ChromaScaleCoef[i] with i ranging from 0 to BinIdx is derived as follows.
ChromaResidualScaleLut[64]={16384,16384,16384,16384,16384,16384,16384,8192,8192,8192,8192,5461,5461,5461,5461,4096,4096,4096,4096,3277,2777 3277,2731,2731,2731,2731,2341,2341,2341,2048,2048,2048,1820,1820,1820,1638,1638,1638,1638,1489,1489,1489,1489,1365,1365,1365, 1365,1260,1260,1260,1260,1170,1170,1170,1170,1092,1092,1092,1092,1024,1024,1024,1024};

shiftC=11
-if (RspCW[i]==0)
ChromaScaleCoef[i]=(1<<shiftC)
-Otherwise(RspCW[i]!=0), ChromaScaleCoef[i]=ChromaResidualScaleLut[RspCW[i]>>1]

8.2.4 ILRの使用
エンコーダ側では、各画像(または、タイル群)が最初に再形成ドメインへ変換される。そして、全てのコード化プロセスは、再形成されたドメインで実行される。イントラ予測について、隣接ブロックは再形成ドメイン内にあり、インター予測について、参照ブロック(復号された画像バッファからの元のドメインから生成されたもの)が、最初に再形成ドメインへ変換される。次いで、残余が生成され、そして、ビットストリームへコード化される。
8.2.4 Using ILR On the encoder side, each image (or set of tiles) is first transformed into the reconstructed domain. All encoding processes are then performed in the reshaped domain. For intra-prediction, neighboring blocks are in the reconstructed domain, and for inter-prediction, the reference block (generated from the original domain from the decoded image buffer) is first transformed into the reconstructed domain. A residue is then generated and coded into a bitstream.

全体画像(または、タイル群)の符号化/復号化が終了した後で、再形成ドメイン内のサンプルは、元のドメインへ変換され、次いで、非ブロック化(deblocking)フィルタおよび他のフィルタが適用される。 After the entire image (or tiles) has been encoded/decoded, the samples in the reshaped domain are transformed back to the original domain, then deblocking and other filters are applied. be done.

予測信号に対する前方再形成(forward reshaping)は、以下の場合についてディセーブルされる。
-現在ブロックがイントラコード化されている。
-現在ブロックがCPR(現在画像参照、別名イントラブロックコピー、IBC)としてコード化されている。
-現在のブロックが、結合インター-イントラモード(CIIP)としてコード化されており、かつ、イントラ予測ブロックについて前方再形成がディセーブルされている。
Forward reshaping for prediction signals is disabled for the following cases.
- The block is currently intra-coded.
- The current block is coded as CPR (current picture reference, aka intra block copy, IBC).
- The current block is coded as combined inter-intra mode (CIIP) and forward reconstruction is disabled for intra-predicted blocks.

9 既存の実装の欠点
JVET-N0242における非線形ALF(NLALF)設計は、以下の問題を有している。
(1)4:2:0カラーフォーマット用に設計されたものであること。4:4:4カラーフォーマットについて、ルマ成分とクロマ成分が同様に重要であり得ること。どのようにNLALFをより良好に適用するか不明であること。
(2)クリッピング値が10ビットの場合について設計されていること。他のビット深度について、どのようにNLALFを定義するか未だ研究されていないこと。
(3)ループ内再形成法とNLALFの相互作用は、研究されてきていないこと。
9 Shortcomings of existing implementations
The nonlinear ALF (NLALF) design in JVET-N0242 has the following problems.
(1) be designed for the 4:2:0 color format; For a 4:4:4 color format, luma and chroma components can be equally important. Not sure how to better apply NLALF.
(2) Designed for 10-bit clipping values. How to define NLALF for other bit depths has not yet been explored.
(3) the interplay between intra-loop reformation and NLALF has not been studied.

10 非線形適応ループフィルタリングにおける改善のための例示的方法
ここで開示される技術の実施形態は、既存の実施形態の欠点を克服し、それによって、より高いコード化効率を有するビデオコーディングを提供する。非線形適応ループフィルタリングは、開示される技術に基づいて、既存の及び将来のビデオコーディング規格の両方を強化知るものであり、種々の実装について説明される以降の実施例において解明される。以下に提供される開示された技術の例は、一般的概念を説明するものであり、そして、限定的なものとして解釈されるように意図されたものではない。一つの例において、明示的に反対に示されない限り、これらの実施例において説明される種々の特徴を組み合わせることができる。
1.NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、コード化された情報に依存し得ることが提案されている。
a.NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、時間層インデックス/低遅延チェックフラグ/参照画像に依存し得ることが提案されている。
2.複数セットのNLALFパラメータが定義され、または、信号化され得る。
a.代替的に、さらに、複数セットのNLALFパラメータが信号化される場合、それらは適応パラメータセット(APS)/タイル群ヘッダ/ビデオデータユニットといった、データユニット(data unit)で信号化され得る。
b.一つの例では、NLALFパラメータは、予測的な方法で信号化される。
i.例えば、1つのデータユニット(APSまたはタイル群、もしくはスライス、といったもの)で信号化されたNLALFパラメータの1つのセットは、同じデータユニットで信号化された別のNLALFパラメータのセットによって予測される。
ii.例えば、1つのデータユニット(APSまたはタイル群、もしくはスライス、といったもの)で信号化されたNLALFパラメータの1つのセットは、別のデータユニットで信号化された別のNLALFパラメータのセットによって予測される。
3.NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、NLALFを適用する前に、再構成されたサンプルのビット深度に依存し得ることが提案される。
a.代替的に、NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、符号化/復号化される前に、サンプルの入力ビット深度に依存し得ることが提案されている。
b.一つの例では、所与のビット深度に対するパラメータは、他のビット深度に対して割り当てられたものから導出され得る。
i.一つの例では、1つの所与のビット深度に対するパラメータを導出するために、ビット深度に従ったシフト動作(shifting operation)が適用され得る。
4.NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、色表現フォーマット(color representation format)に依存し得ることが提案されている。
a.一つの例では、RGBの場合、G色成分について、および、B/R色成分について、同じインデックスを持つパラメータである。
5.NLALFで使用されるパラメータ(例えば、表2で定義されたクリッピングパラメータ)は、ループ内再形成(ILR)法が適用されるか否かに依存し得ることが提案されている。
a.一つの例では、ILRがイネーブルまたはディセーブルされている場合、パラメータが異なり得る。
6.フィルタパラメータ(フィルタ係数といったもの)およびNLALFパラメータ(クリッピングパラメータといったもの)を一緒に保管することが提案されている。
a.一つの例では、それらの両方がAPSに保管され得る。
b.一つの例では、1つのビデオデータユニット(例えば、CTU/領域/タイル群)が1つのAPSに関連するフィルタ係数を使用する場合、関連するNLALFパラメータも、また、使用され得る。
c.代替的に、1つのビデオデータユニット(例えば、CTU/領域/タイル群)に符号化/復号化について、1つのAPSに関連するフィルタ係数からの予測がイネーブルされている場合、関連するNLALFパラメータは、また、同じAPSからの1つのビデオデータユニットに対するNLALFパラメータを予測するためにも利用され得る。
7.クロマ色成分についてNLALFの扱い方は、カラーフォーマットに依存し得る。
a.1つの例では、(4:4:4といった)所与のカラーフォーマットについて、2つのクロマ成分が異なるNLALFパラメータを使用し得る。
8.ALFでのクリッピングは、シーケンスレベル、ピクチャレベル、スライスレベル、タイル群レベル、タイルレベル、CTUレベル、CUレベル、またはブロックレベルでオンまたはオフにされ得ることが提案されている。
a.例えば、ALFでクリッピングをオンにするか否かは、デコーダに信号化され得る。SPS、PPS、スライスヘッダ、タイル群ヘッダ、タイル、CTU、CU、またはブロックといったものである。
10 Exemplary Methods for Improvements in Nonlinear Adaptive Loop Filtering Embodiments of the technology disclosed herein overcome shortcomings of existing embodiments, thereby providing video coding with higher coding efficiency . Non-linear adaptive loop filtering enhances both existing and future video coding standards based on the disclosed techniques and is elucidated in subsequent examples describing various implementations. Examples of the disclosed technology provided below are illustrative of general concepts and are not intended to be construed as limiting. In one example, various features described in these embodiments can be combined unless explicitly indicated to the contrary.
1. It has been proposed that the parameters used in NLALF (eg, the clipping parameters defined in Table 2) may depend on the coded information.
a. It is proposed that the parameters used in NLALF (eg, the clipping parameters defined in Table 2) may depend on the temporal layer index/low-delay check flag/reference image.
2. Multiple sets of NLALF parameters can be defined or signaled.
a. Alternatively, in addition, when multiple sets of NLALF parameters are signaled, they may be signaled in data units such as adaptive parameter sets (APS)/tile group headers/video data units.
b. In one example, the NLALF parameters are signaled in a predictive manner.
i. For example, one set of NLALF parameters signaled in one data unit (such as APS or tile group or slice) is predicted by another set of NLALF parameters signaled in the same data unit. be.
ii. For example, one set of NLALF parameters signaled in one data unit (such as APS or tiles or slices) is predicted by another set of NLALF parameters signaled in another data unit. be done.
3. It is proposed that the parameters used in NLALF (eg, the clipping parameters defined in Table 2) may depend on the bit depth of the reconstructed samples before applying NLALF.
a. Alternatively, it is proposed that the parameters used in NLALF (e.g., the clipping parameters defined in Table 2) may depend on the input bit depth of the samples before they are encoded/decoded. there is
b. In one example, the parameters for a given bitdepth can be derived from those assigned for other bitdepths.
i. In one example, a shifting operation according to bit depth may be applied to derive the parameters for one given bit depth.
4. It has been proposed that the parameters used in NLALF (eg, the clipping parameters defined in Table 2) may depend on the color representation format.
a. In one example, for RGB, parameters with the same index for the G color component and for the B/R color component.
5. It has been proposed that the parameters used in NLALF (eg, the clipping parameters defined in Table 2) may depend on whether the in-loop reconstruction (ILR) method is applied.
a. In one example, the parameters may be different if ILR is enabled or disabled.
6. It is proposed to store the filter parameters (like filter coefficients) and NLALF parameters (like clipping parameters) together.
a. In one example, they can both be stored in the APS.
b. In one example, if one video data unit (eg, CTU/region/group of tiles) uses filter coefficients associated with one APS, the associated NLALF parameters may also be used.
c. Alternatively, for encoding/decoding into one video data unit (e.g., CTU/region/group of tiles), associated NLALF if prediction from filter coefficients associated with one APS is enabled. The parameters can also be used to predict NLALF parameters for one video data unit from the same APS.
7. The treatment of NLALF for chroma color components can depend on the color format.
a. In one example, for a given color format (such as 4:4:4), two chroma components may use different NLALF parameters.
8. It is proposed that clipping in ALF can be turned on or off at the sequence level, picture level, slice level, tile group level, tile level, CTU level, CU level, or block level.
a. For example, whether to turn on clipping in ALF can be signaled to the decoder. SPS, PPS, slice header, tile group header, tile, CTU, CU, or block.

上述の例は、以下に記載される方法、例えば、方法810から840、のコンテキストに組み込むことができ、ビデオデコーダまたはビデオエンコーダで実装され得る。 The above examples may be incorporated in the context of the methods described below, eg, methods 810-840, and may be implemented in a video decoder or encoder.

図8Aは、ビデオ処理のための例示的な方法のフローチャートを示している。方法810は、ステップ812において、ビデオのビデオユニットを符号化ビデオユニットとして符号化するステップを含む。方法810は、さらに、ステップ813において、符号化ビデオユニットから再構成サンプルを生成するステップを含む。方法810は、さらに、ステップ814において、再構成サンプルに対してクリッピング動作を実行するステップを含む。ここで、クリッピング動作で使用されるクリッピングパラメータは、クリッピングインデックス、および、再構成サンプルのビット深度またはビデオユニットのサンプルのビット深度に係る関数である。方法810は、さらに、ステップ815において、クリッピング動作の出力に対して非線形適応ループフィルタを適用するステップを含む。方法810は、さらに、ステップ816において、符号化ビデオユニットを使用して、ビデオのコード化表現を生成するステップを含む。 FIG. 8A shows a flowchart of an exemplary method for video processing. The method 810 includes encoding the video units of the video as coded video units at step 812 . Method 810 further includes generating reconstructed samples from the encoded video units at step 813 . Method 810 further includes performing a clipping operation on the reconstructed samples at step 814 . Here, the clipping parameter used in the clipping operation is a function of the clipping index and the bit depth of the reconstructed samples or the bit depth of the samples of the video unit. Method 810 further includes applying a nonlinear adaptive loop filter to the output of the clipping operation at step 815 . Method 810 further includes generating a coded representation of the video using the coded video units at step 816 .

図8Bは、ビデオ処理のための例示的な方法のフローチャートを示している。この方法820は、ステップ822において、ビデオのビデオユニットを表す符号化ビデオユニットのためのビデオのコード化表現を解析するステップを含む。方法820は、ステップ823において、符号化ビデオユニットからビデオユニットの再構成サンプルを生成することをさらに含む。方法820は、ステップ824において、再構成サンプルに対してクリッピング動作を実行するステップを含み、クリッピング動作で使用されるクリッピングパラメータは、クリッピングインデックスおよび再構成サンプルのビット深度またはビデオユニットのビット深度の関数である。この方法820はさらに、ステップ825において、非線形適応ループフィルタをクリッピング動作の出力に適用して、最終的な復号ビデオユニットを生成するステップを含む。 FIG. 8B shows a flowchart of an exemplary method for video processing. The method 820 includes, at step 822, parsing the coded representation of the video for encoded video units representing video units of the video. The method 820 further includes generating reconstructed samples of the video units from the encoded video units at step 823 . The method 820 includes performing a clipping operation on the reconstructed samples at step 824, the clipping parameters used in the clipping operation being a function of the clipping index and the reconstructed sample bit depth or video unit bit depth. is. The method 820 further includes applying a non-linear adaptive loop filter to the output of the clipping operation at step 825 to produce the final decoded video unit.

図8Cは、ビデオ処理のための例示的な方法のフローチャートを示している。方法830は、ステップ832において、1つ以上のビデオ領域を含むビデオのコード化表現と、ビデオとの間の変換を実行するステップを含む。方法830は、さらに、ステップ834において、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップを含む。いくつかの実施態様において、決定は、ビデオ、及び/又は、ビデオ領域、及び/又は、ビデオユニットのコード化情報に基づいている。いくつかの実装において、クリッピングパラメータは色表現フォーマットの関数である。いくつかの実装において、クリッピングパラメータは、第1ドメインおよび第2ドメインにおけるビデオユニットの表現、及び/又は、クロマビデオユニットのクロマ残余のスケーリングに基づいて、前記ビデオユニットを再構成するためにループ内再形成(ILR)が適用されるか否かに依存する。 FIG. 8C shows a flowchart of an exemplary method for video processing. The method 830 includes performing a conversion between the video and a coded representation of the video including one or more video regions at step 832 . The method 830 further includes determining clipping parameters for filtering the reconstruction of the video unit in the video domain using the non-linear adaptive loop filter at step 834 . In some embodiments, the determination is based on coding information of the video and/or video regions and/or video units. In some implementations, the clipping parameter is a function of the color rendering format. In some implementations, the clipping parameters are in-loop to reconstruct the video unit based on the representation of the video unit in the first domain and the second domain and/or the scaling of the chroma residual of the chroma video unit. Depends on whether reshaping (ILR) is applied or not.

図9は、ビデオ処理のための例示的方法のフローチャートを示している。方法840は、1つ以上のビデオ領域を含むビデオのコード化表現と、ビデオとの間の変換を実行するステップを含む。いくつかの実装において、コード化表現は、非線形適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する第1側面情報を含み、第1側面情報は、非線形適応ループフィルタにおいて使用されるフィルタ係数を示している第2側面情報と共に信号化される。いくつかの実装において、コード化表現は、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータの複数のセットを示している側面情報を含む。いくつかの実装において、コード化表現は、非線形適応ループフィルタを使用して、ビデオ領域のクロマビデオユニットの再構成をフィルタリングするための1つ以上のクリッピングパラメータを提供する側面情報を含み、1つ以上のクリッピングパラメータはカラーフォーマットに依存する。いくつかの実装において、コード化表現は、適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する側面情報を含む。ここで、実行するステップは、ビデオ領域レベルでの差異をサンプリングするためにクリッピング動作を適用することによって、フィルタリングされたビデオユニットを生成するステップを含む。 FIG. 9 shows a flowchart of an exemplary method for video processing. Method 840 includes performing conversions to and from a coded representation of video that includes one or more video regions. In some implementations, the coded representation includes first flank information providing clipping parameters for filtering reconstructions of video units in the video domain using a nonlinear adaptive loop filter, the first flank information comprising: Signaled with second flank information indicating the filter coefficients used in the non-linear adaptive loop filter. In some implementations, the coded representation includes side information indicating multiple sets of clipping parameters for filtering reconstructions of video units in the video domain using a non-linear adaptive loop filter. In some implementations, the coded representation includes side information that provides one or more clipping parameters for filtering the reconstruction of chroma video units in the video domain using a nonlinear adaptive loop filter, one The above clipping parameters depend on the color format. In some implementations, the coded representation includes side information that provides clipping parameters for filtering reconstructions of video units in the video domain using an adaptive loop filter. Here, the performing includes generating filtered video units by applying a clipping operation to sample differences at the video domain level.

11 開示される技術の実施例
図10Aは、ビデオ処理装置900のブロック図である。装置900は、ここにおいて記載される1つ以上の方法を実装するために使用され得る。装置900は、スマートフォン、タブレット、コンピュータ、モノのインターネット(Internet of Things、IoT)受信器、などで具体化することができる。装置900は、1つ以上のプロセッサ902、1つ以上のメモリ904、および、ビデオ処理ハードウェア906を含み得る。プロセッサ902は、本文書に記載される1つ以上の方法(方法800を含むが、これに限定されない)を実装するように構成され得る。メモリ(メモリ)904は、ここにおいて記載される方法および技術を実施するために使用されるデータおよびコードを保管するために使用され得る。ビデオ処理ハードウェア906は、ハードウェア回路において、本文書に記載されるいくつかの技術を実装するために使用され得る。
11 Embodiments of the Disclosed Technology FIG. 10A is a block diagram of a video processing device 900 . Apparatus 900 can be used to implement one or more methods described herein. Device 900 can be embodied in a smart phone, tablet, computer, Internet of Things (IoT) receiver, and the like. Device 900 may include one or more processors 902 , one or more memories 904 and video processing hardware 906 . Processor 902 may be configured to implement one or more methods described in this document (including, but not limited to, method 800). Memory (memory) 904 can be used to store data and code used to implement the methods and techniques described herein. Video processing hardware 906 may be used to implement some of the techniques described in this document in hardware circuits.

図10Bは、開示される技術を実装することができるビデオ処理システムのブロック図の別の例である。図10Bは、ここにおいて開示される様々な技術が実装され得る例示的なビデオ処理システム4100を示しているブロック図である。様々な実装は、システム4100の構成要素の一部または全部を含み得る。システム4100は、ビデオコンテンツを受信するための入力4102を含み得る。ビデオコンテンツは、生または非圧縮フォーマット、例えば、8または10ビットの多成分画素値で受信されてよく、または、圧縮または符号化フォーマットで受信されてもよい。入力4102は、ネットワークインターフェイス、周辺バスインターフェイス、または、ストレージインターフェイスを表すことができる。ネットワークインターフェイスの例は、イーサネット、受動光ネットワーク(PON)、等といった有線インターフェイス、および、Wi-Fiまたはセルラーインターフェイスといった無線インターフェイスを含む。 FIG. 10B is another example block diagram of a video processing system that can implement the disclosed techniques. FIG. 10B is a block diagram illustrating an exemplary video processing system 4100 in which various techniques disclosed herein may be implemented. Various implementations may include some or all of the components of system 4100 . System 4100 may include an input 4102 for receiving video content. Video content may be received in raw or uncompressed format, eg, 8- or 10-bit multi-component pixel values, or may be received in compressed or encoded format. Input 4102 can represent a network interface, a peripheral bus interface, or a storage interface. Examples of network interfaces include wired interfaces such as Ethernet, Passive Optical Network (PON), etc., and wireless interfaces such as Wi-Fi or cellular interfaces.

システム4100は、本文書に記載される種々のコード化または符号化方法を実装し得るコード化構成要素4104を含んでよい。コード化構成要素4104は、入力4102からコード化構成要素4104の出力へのビデオの平均ビットレートを低減して、ビデオのコード化表現を生成し得る。従って、コード化技術は、ときどき、ビデオ圧縮またはビデオトランスコード化(video transcoding)技術と呼ばれている。コード化構成要素4104の出力は、構成要素4106によって表されるように、保管されるか、または、接続された通信を介して送信されてよい。入力4102で受信されたビデオの保管または通信されたビットストリーム(またはコード化された)表現は、ディスプレイインターフェイス4110に送信される画素値または表示可能なビデオを生成するために、構成要素4108によって使用されてもよい。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ解凍(video decompression)と呼ばれ得る。さらに、特定のビデオ処理動作は、「コード化(“coding”)」動作またはツールと称され、一方で、コード化ツールまたは動作は、エンコーダで使用され、そして、コード化の結果を反転する対応する復号化ツールまたは動作は、デコーダで実行されることが理解されるだろう。 System 4100 may include encoding component 4104 that may implement various encodings or encoding methods described in this document. Encoding component 4104 may reduce the average bitrate of the video from input 4102 to the output of encoding component 4104 to produce a coded representation of the video. Therefore, coding techniques are sometimes referred to as video compression or video transcoding techniques. The output of encoding component 4104 may be stored or transmitted via connected communications, as represented by component 4106 . The stored or communicated bitstream (or coded ) representation of the video received at input 4102 is used by component 4108 to generate pixel values or displayable video that are sent to display interface 4110. may be The process of generating user-viewable video from a bitstream representation may be referred to as video decompression. Further, certain video processing operations are referred to as " coding " operations or tools, while coding tools or operations are used in encoders and corresponding methods that invert the result of encoding. It will be appreciated that any decoding tool or operation that performs

ペリフェラルバスインターフェイスまたはディスプレイインターフェイスの例は、ユニバーサルシリアルバス(USB)、または、高精細度マルチメディアインターフェイス(HDMI(登録商標))、もしくは、ディスプレイポート、などを含み得る。ストレージインターフェイスの例は、SATA(serial advanced technology attachment)、PCI、IDEインターフェイス、などを含み得る。ここにおいて記載される技術は、携帯電話、ラップトップ、スマートフォン、または、デジタルデータ処理及び/又はビデオ表示を実行することができる他の装置といった、種々の電子装置において具体化され得る。 Examples of peripheral bus interfaces or display interfaces may include Universal Serial Bus (USB), or High Definition Multimedia Interface (HDMI®), or DisplayPort, or the like. Examples of storage interfaces may include serial advanced technology attachment (SATA), PCI, IDE interfaces, and the like. The techniques described herein may be embodied in various electronic devices such as mobile phones, laptops, smart phones, or other devices capable of performing digital data processing and/or video display.

開示される技術のいくつかの実施形態は、ビデオ処理ツールまたはモードを可能にする決定または判定を行うことを含む。一つの例では、ビデオ処理ツールまたはモードがイネーブルされている場合、エンコーダは、ビデオのブロックの処理においてツールまたはモードを使用または実装するが、必ずしもツールまたはモードの使用に基づいて結果として生じるビットストリームを修正しなくてよい。すなわち、ビデオのブロックからビデオのビットストリーム表現への変換は、決定または判定に基づいて可能にされたとき、ビデオ処理ツールまたはモードを使用する。別の例では、ビデオ処理ツールまたはモードがイネーブルされている場合、デコーダは、ビットストリームがビデオ処理ツールまたはモードに基づいて修正されたことを知って、ビットストリームを処理する。すなわち、ビデオのビットストリーム表現からビデオのブロックへの変換は、決定または判定に基づいてイネーブルされたビデオ処理ツールまたはモードを使用して実行される。 Some embodiments of the disclosed technology involve making decisions or determinations to enable video processing tools or modes. In one example, if a video processing tool or mode is enabled, the encoder uses or implements the tool or mode in processing blocks of video, but not necessarily the resulting bitstream based on use of the tool or mode. do not need to be modified. That is, conversion from blocks of video to bitstream representations of video uses video processing tools or modes when enabled based on decisions or judgments. In another example, if a video processing tool or mode is enabled, the decoder processes the bitstream knowing that the bitstream has been modified based on the video processing tool or mode. That is, conversion from a bitstream representation of video to blocks of video is performed using video processing tools or modes that are enabled based on the decision or determination.

開示される技術のいくつかの実施形態は、ビデオ処理ツールまたはモードをディセーブルにする決定または判定を行うことを含む。一つの例では、ビデオ処理ツールまたはモードがディセーブルされている場合に、エンコーダは、ビデオのブロックをビデオのビットストリーム表現に変換する際に、ツールまたはモードを使用しない。別の例では、ビデオ処理ツールまたはモードがディセーブルされている場合、デコーダは、ビットストリームが、決定または判定に基づいてディセーブルされたビデオ処理ツールまたはモードを使用して修正されていないこと知って、ビットストリームを処理する。 Some embodiments of the disclosed technology involve making a decision or determination to disable a video processing tool or mode. In one example, when a video processing tool or mode is disabled, the encoder does not use the tool or mode in converting blocks of video into a bitstream representation of the video. In another example, if a video processing tool or mode is disabled, the decoder knows that the bitstream has not been modified using the disabled video processing tool or mode based on the decision or judgment. to process the bitstream.

本文書において、「ビデオ処理(“video processing”)という用語は、ビデオエンコーディングビデオデコーディング、ビデオ圧縮またはビデオ解凍を指すことができる。例えば、ビデオ圧縮アルゴリズムは、ビデオの画素表現から対応するビットストリーム表現への変換の最中に適用されてよく、また、その逆も同様である。現在ビデオブロックのビットストリーム表現は、例えば、シンタックスによって定義されるように、ビットストリーム内の異なる場所に同時配置されるか、または、拡散されるビットに対応し得る。例えば、マクロブロックは、変換され、かつ、コード化されたエラー残余値の観点から符号化され、かつ、ビットストリーム内のヘッダおよび他のフィールド内のビットを使用してコード化されてよい。 In this document, the term "video processing" can refer to video encoding , video decoding , video compression or video decompression. It may be applied during conversion to a stream representation, and vice versa: the bitstream representation of the current video block may be placed in different places in the bitstream, e.g., as defined by the syntax. Co-located or may correspond to spread bits, e.g., a macroblock is encoded in terms of a transformed and coded error residual value, and a header and It may be coded using bits in other fields.

いくつかの実施形態において、ビデオコーディング方法は、図10Aまたは10Bに関して説明したようなハードウェアプラットフォーム上に実装される装置を使用して、実装され得る。 In some embodiments, the video coding method may be implemented using apparatus implemented on a hardware platform such as described with respect to Figures 10A or 10B.

様々な技術および実施形態が、以下の条項ベースの(clause-based)フォーマットを使用して説明され得る。 Various techniques and embodiments may be described using the following clause-based format.

条項の第1セットは、以前のセクションで列挙された開示される技術に係る所定の特徴および態様を記述する。 A first set of clauses describes certain features and aspects of the disclosed technology that are listed in previous sections.

1.現在のビデオブロックのコード化情報に基づいて、前記現在のビデオブロックのためのパラメータのセットを決定するステップと、前記パラメータのセットを使用して非線形フィルタリング動作を実行するステップに基づいて、前記現在のビデオブロックを対応するビットストリーム表現から再構成するステップとを含む、ビデオ処理のための方法。 1. Based on coding information for the current video block, determining a set of parameters for said current video block, and performing a non-linear filtering operation using said set of parameters, reconstructing said current video block from a corresponding bitstream representation.

2.前記非線形フィルタリング動作は、非線形適応ループフィルタリングを含む、第1条項に記載の方法。 2. The method of clause 1, wherein said non-linear filtering operation comprises non-linear adaptive loop filtering.

3.前記パラメータのセットは、現在のビデオブロックのルマ成分またはクロマ成分に対する少なくとも1つのクリッピング値を含む、第1条項または第2条項に記載の方法。 3. The method of clause 1 or clause 2, wherein the set of parameters comprises at least one clipping value for luma or chroma components of the current video block.

4.前記非線形フィルタリング動作は、前記クロマ成分のカラーフォーマットに基づく、第3条項に記載の方法。 4. The method of clause 3, wherein said non-linear filtering operation is based on the color format of said chroma components.

5.前記コード化情報は、時間層インデックス、低遅延チェックフラグ、または1つ以上の参照画像を含む、第1条項乃至第3条項のいずれかに記載の方法。 5. The method of any of clauses 1-3, wherein the coded information comprises a temporal layer index, a low-delay check flag, or one or more reference images.

6.前記コード化情報は、前記非線形フィルタリング動作の前のビット深度の再構成されたサンプルを含む、第1条項乃至第3条項のいずれかに記載の方法。 6. The method of any of clauses 1-3, wherein the coded information comprises reconstructed samples of bit depth prior to the non-linear filtering operation.

7.前記コード化情報が、カラー表現形式を含む、第1条項乃至第3条項のいずれかに記載の方法。 7. A method according to any of clauses 1-3, wherein the coded information comprises a color representation format.

8.前記コード化情報が、ループ内再形成法を適用する表示を含む、第1条項乃至第3条項のいずれかに記載の方法。 8. The method of any of clauses 1-3, wherein the coded information includes an indication of applying an in-loop reconstruction method.

9.前記対応するビットストリーム表現は、前記パラメータセットを含む複数セットのパラメータを含み、前記複数セットのパラメータは、適応パラメータセット(APS)、タイル群ヘッダ、または1つ以上のビデオデータユニットで信号化される、第1条項乃至第3条項のいずれかに記載の方法。 9. Said corresponding bitstream representation comprises a plurality of sets of parameters comprising said parameter set, said plurality of sets of parameters signaled in an adaptive parameter set (APS), a tile group header, or one or more video data units. The method of any one of Clauses 1-3, wherein the method is

10.前記対応するビットストリーム表現は、前記パラメータのセットと、前記非線形フィルタリング動作に関連する1つ以上のフィルタ係数とを含む適応パラメータセットを含む、第1条項乃至第3条項のいずれかに記載の方法。 10. Clause 1-3, wherein said corresponding bitstream representation comprises an adaptive parameter set comprising said set of parameters and one or more filter coefficients associated with said non-linear filtering operation. the method of.

11.前記パラメータのセットは、1つ以上のクリッピング値を含み、前記非線形フィルタリング動作は、シーケンスレベル、ピクチャレベル、スライスレベル、タイル群レベル、タイルレベル、コーディングツリーユニットレベル、コーディングユニットレベル、またはブロックレベルで実行される、第1条項または第2条項に記載の方法。 11. The set of parameters includes one or more clipping values, and the nonlinear filtering operation is sequence level, picture level, slice level, tile group level, tile level, coding tree unit level, coding unit level, or block. A method according to Clause 1 or Clause 2, which is carried out at the level.

12.プロセッサと、その上に命令を有する非一時的メモリとを備えるビデオシステム内の装置であって、前記プロセッサによる実行の際に、前記命令によって、前記プロセッサは、第1条項から第11条項までのいずれか1つにおいて前記方法を実行させる、装置。 12. Apparatus in a video system comprising a processor and non-transitory memory having instructions thereon, wherein said instructions, upon execution by said processor, cause said processor to: An apparatus for performing the method in any one of

13.非一時的なコンピュータ読取り可能媒体に保管されたコンピュータプログラム製品であって、第1条項から第11条項までのいずれかに記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。 13. A computer program product stored on a non-transitory computer readable medium, the computer program product containing program code for carrying out the method of any of Clauses 1 to 11.

条項の第2セットは、以前のセクションで列挙された開示される技術に係る所定の特徴および態様を記述する。例えば、実施例1および実施例3-5を含んでいる。 A second set of clauses describes certain features and aspects of the disclosed technology that are listed in previous sections. Examples include Example 1 and Examples 3-5.

1.ビデオのビデオユニットを符号化ビデオユニットとして符号化するステップと、前記符号化ビデオユニットから再構成サンプルを生成するステップと、前記再構成サンプルに対してクリッピング演算を行うステップであって、前記クリッピング演算に使用されるクリッピングパラメータは、クリッピング指数及び前記再構成サンプルのビット深度又は前記ビデオユニットのサンプルのビット深度の関数である、ステップと、非線形適応ループフィルタを前記クリッピング演算の出力に適用するステップと、前記符号化ビデオユニットを使用して前記ビデオのコード化表現を生成するステップと、を含む、ビデオ処理方法。 1. encoding video units of a video as encoded video units; generating reconstructed samples from said encoded video units; and performing a clipping operation on said reconstructed samples, said applying a nonlinear adaptive loop filter to the output of the clipping operation, wherein the clipping parameter used in the clipping operation is a function of the clipping index and the bit depth of the reconstructed samples or the bit depth of the samples of the video unit; and generating a coded representation of said video using said coded video units.

2.第1条項に記載の方法であって、前記クリッピングインデックスは、前記コード化表現において信号化されることを特徴とする方法。 2. A method according to clause 1, characterized in that said clipping index is signaled in said coded representation.

3.ビデオのビデオユニットを表す符号化ビデオユニットに対するビデオのコード化表現を解析するステップと、前記符号化ビデオユニットから前記ビデオユニットの再構成サンプルを生成するステップと、前記再構成サンプルに対するクリッピング演算を実行するステップであって、前記クリッピング演算で使用されるクリッピングパラメータは、クリッピングインデックス及び前記再構成サンプルのビット深度又は前記ビデオユニットのビット深度の関数である、ステップと、最終的な復号化ビデオユニットを生成するために、前記クリッピング演算の出力に非線形適応ループフィルタを適用するステップと、を含むビデオ処理方法。 3. parsing a coded representation of a video for encoded video units representing video units of a video; generating reconstructed samples of said video units from said encoded video units; and clipping operations on said reconstructed samples. wherein the clipping parameter used in the clipping operation is a function of the clipping index and the bit depth of the reconstructed samples or the bit depth of the video unit; applying a non-linear adaptive loop filter to the output of said clipping operation to generate units.

4.第3条項に記載の方法であって、前記クリッピングインデックスは、少なくとも、前記コード化表現におけるフィールドに基づいて決定される、方法。 4. The method of clause 3, wherein the clipping index is determined based at least on fields in the coded representation.

5.前記クリッピングインデックスは、事前に定義されたルールを使用して決定される、第3条項に記載の方法。 5. The method of clause 3, wherein said clipping index is determined using pre-defined rules.

6.前記クリッピングインデックス及び前記再構成サンプルのビット深度又は前記ビデオユニットのビット深度の関数は、前記再構成サンプルのビット深度又は前記ビデオユニットのビット深度に基づいて、前記クリッピングインデックスの所与の値に対して異なる値を返すようなものである、第1条項または第3条項に記載の方法。 6. A function of the clipping index and the reconstructed sample bit-depth or the video unit bit-depth is a given value of the clipping index based on the reconstructed sample bit-depth or the video unit bit-depth. The method of Clause 1 or Clause 3, which is such that it returns different values for

7.クリッピングインデックスとクリッピングパラメータとの間のマッピングは、再構成サンプルのビット深度またはビデオユニットのビット深度に依存する、第1条項または第3条項に記載の方法。 7. The method of clause 1 or clause 3, wherein the mapping between clipping indices and clipping parameters depends on the bit depth of the reconstructed samples or the bit depth of the video unit.

8.所与のビット深度に対する第1のクリッピングインデックスに対応する第1のクリッピング値は、別のビット深度に対する第2のクリッピングインデックスに対応する第2のクリッピング値に基づいて導出される、第1条項または第3条項に記載の方法。 8. A first clipping value corresponding to a first clipping index for a given bit depth is derived based on a second clipping value corresponding to a second clipping index for another bit depth. in the manner described in Clause or Clause 3.

9.別のビット深度を使用するシフト演算が、与えられたビット深度に対するクリッピングパラメータを導出するために適用される、第8条項に記載の方法。 9. The method of clause 8, wherein a shift operation using another bit-depth is applied to derive the clipping parameter for a given bit-depth.

10.前記コード化表現は、前記非線形適応ループフィルタにおいて使用される2つのサンプル差の上限又は下限を制御するクリッピングパラメータを含む、第1条項乃至第9条項のいずれかに記載の方法。 10. A method according to any of clauses 1-9, wherein the coded representation includes a clipping parameter controlling an upper or lower bound on the difference between two samples used in the nonlinear adaptive loop filter.

11.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップとを含み、前記決定は、前記ビデオ及び/又は前記ビデオ領域及び/又は前記ビデオユニットのコード化情報に基づいて行われることを特徴とするビデオ処理方法。 11. Performing a transform between a coded representation of a video containing one or more video regions and said video, and clipping for filtering a reconstruction of video units of the video region using a non-linear adaptive loop filter. determining a parameter, said determining being based on coding information of said video and/or said video region and/or said video unit.

12.前記コード化情報は、時間層インデックスを含む、第11条項に記載の方法。 12. The method of clause 11, wherein said coded information comprises a temporal stratum index.

13.前記コード化情報は、低遅延チェックフラグを含む、第11条項に記載の方法。 13. The method of clause 11, wherein said coded information includes a low-latency check flag.

14.前記コード化情報は、1つ以上の参照画像を含む、第11条項に記載の方法。 14. The method of clause 11, wherein said coded information includes one or more reference images.

15.前記ビデオ領域は、ビデオ画像を含む、第11条項乃至第14条項のいずれかに記載の方法。 15. A method according to any of clauses 11-14, wherein said video area comprises a video image.

16.前記ビデオユニットが符号化ユニットを備える、第11条項乃至第14条項のいずれかに記載の方法。
16. A method according to any of clauses 11-14, wherein said video units comprise encoding units.

17.クリッピングパラメータが、非線形適応ループフィルタで使用される2つのサンプル差の上限または下限を制御する、第11条項乃至第16条項のいずれかに記載の方法。 17. A method according to any of clauses 11-16, wherein the clipping parameter controls the upper or lower bound of the two sample difference used in the non-linear adaptive loop filter.

18.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップとを含み、前記クリッピングパラメータは、カラー表現形式の関数である、ビデオ処理方法。 18. Performing a transform between a coded representation of a video containing one or more video regions and said video, and clipping for filtering a reconstruction of video units of the video region using a non-linear adaptive loop filter. determining a parameter, wherein said clipping parameter is a function of a color representation format.

19.RGBカラーフォーマットについて、クリッピングパラメータは、緑色成分および青色または赤色成分について同じインデックスを有する、第18条項に記載の方法。 19. The method of clause 18, wherein for RGB color formats the clipping parameters have the same indices for the green and blue or red components.

20.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間の変換を実行するステップと、非線形適応ループフィルタを使用して、ビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを決定するステップとを含み、前記クリッピングパラメータは、第1のドメインおよび第2のドメインにおける前記ビデオユニットの表現、及び/又は、クロマビデオユニットのクロマ残余に基づいて、前記ビデオユニットを再構成するためにループ内再形成が適用されるか否かに依存する、ビデオ処理方法。 20. Performing a transform between a coded representation of a video containing one or more video regions and said video, and clipping for filtering a reconstruction of video units of the video region using a non-linear adaptive loop filter. determining a parameter, the clipping parameter reconstructing the video unit based on a representation of the video unit in first and second domains and/or a chroma residual of the chroma video unit. A video processing method that relies on whether or not in-loop reconstruction is applied to do so.

21.クリッピングパラメータが、ビデオユニットのルマ成分またはクロマ成分のクリッピング値に対応する、第1条項乃至第21条項のいずれかに記載の方法。 21. A method according to any of clauses 1-21, wherein the clipping parameters correspond to clipping values of luma or chroma components of the video unit.

22.前記方法は、前記変換中に、前記非線形適応ループフィルタを前記ビデオユニットの再構成に適用し、前記フィルタリングされたビデオユニットを前記ビデオの別のビデオユニットの予測を決定するために使用することによって、フィルタリングされたビデオユニットを生成することをさらに含む、第1条項乃至第21条項のいずれかに記載の方法。 22. The method applies the non-linear adaptive loop filter to reconstruct the video unit during the transform and uses the filtered video unit to determine a prediction of another video unit of the video. Clause 22. The method of any of clauses 1-21, further comprising generating the filtered video unit by.

23.前記変換の実行は、前記ビデオから前記コード化表現を生成することを含む、第1条項乃至第22条項のいずれかに記載の方法。 23. A method according to any one of clauses 1-22, wherein performing the transformation comprises generating the coded representation from the video.

24.前記変換の実行は、前記コード化表現から前記ビデオを生成することを含む、第1条項乃至第22条項のいずれかに記載の方法。 24. A method according to any of clauses 1-22, wherein performing the transformation comprises generating the video from the coded representation.

25.プロセッサと、その上に命令を有する非一時的メモリとを備えるビデオシステム内の装置であって、前記プロセッサによる実行の際に、前記命令は、前記プロセッサに、第1条項乃至第24条項のいずれかに記載の方法を実行させる、装置。 25. Apparatus in a video system comprising a processor and non-transitory memory having instructions thereon, wherein said instructions, upon execution by said processor, cause said processor to perform any of the An apparatus for carrying out the method according to any of

26.非一時的なコンピュータ読取り可能媒体に保管されたコンピュータプログラム製品であって、第1条項乃至第24条項のいずれかに記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。 26. A computer program product stored on a non-transitory computer readable medium, the computer program product containing program code for carrying out the method of any of Clauses 1-24.

条項の第3セットは、以前のセクションで列挙された開示される技術に係る所定の特徴および態様を記述する。例えば、実施例2および実施例6-8を含んでいる。 A third set of clauses describes certain features and aspects of the disclosed technology that are listed in previous sections. Examples include Example 2 and Examples 6-8.

1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間で変換を実行するステップを含み、前記コード化表現は、非線形適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する第1側面情報を含み、前記第1側面情報は、前記非線形適応ループフィルタにおいて使用されるフィルタ係数を示している第2側面情報と共に信号化されることを特徴とするビデオ処理方法。 performing a transform between a coded representation of a video comprising one or more video regions and said video, said coded representation using a non-linear adaptive loop filter to reconstruct video units of said video region. wherein said first flank information is signaled with second flank information indicating filter coefficients used in said non-linear adaptive loop filter A video processing method characterized by:

2.前記第1側面情報及び前記第2側面情報は、同一の適応パラメータセット内で信号化される、第1条項に記載の方法。 2. The method of clause 1, wherein said first flank information and said second flank information are signaled within the same adaptation parameter set.

3.適応パラメータセットに関連する前記フィルタ係数の少なくとも一部がビデオデータユニットによって使用される場合、前記適応パラメータセットに関連するクリッピングパラメータもまた、前記ビデオデータユニットによって使用される、第1条項に記載の方法。 3. Clause 1, wherein if at least some of said filter coefficients associated with an adaptive parameter set are used by a video data unit, clipping parameters associated with said adaptive parameter set are also used by said video data unit; described method.

4.適応パラメータセットに関連する前記フィルタ係数のうちの少なくともいくつかからの予測がビデオデータユニットの変換のために有効である場合、前記適応パラメータセットに関連する前記パラメータが、前記適応パラメータセットから別のビデオデータユニットのための別のパラメータを予測するために使用される、第1条項に記載の方法。 4. if prediction from at least some of said filter coefficients associated with an adaptive parameter set is valid for transforming a unit of video data, then said parameters associated with said adaptive parameter set are derived from said adaptive parameter set; The method of clause 1, used to predict another parameter for another video data unit.

5.前記ビデオデータユニットは、コーディングツリーユニット、ビデオ領域、またはタイル群である、第3条項または第4条項に記載の方法。 5. The method of Clause 3 or Clause 4, wherein the video data unit is a coding tree unit, a video region, or a group of tiles.

6.前記パラメータが、前記ビデオユニットのルマ成分またはクロマ成分のクリッピング値に対応する、第1条項乃至第5条項のいずれかに記載の方法。 6. The method of any of clauses 1-5, wherein said parameter corresponds to a clipping value of luma or chroma components of said video unit.

7.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間で変換を実行するステップを含み、前記コード化表現は、非線形適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータの複数のセットを示している側面情報を含む、ビデオ処理方法。 7. Performing a transform between a coded representation of a video comprising one or more video regions and said video, said coded representation using a non-linear adaptive loop filter to reconstruct video units of said video region. A video processing method, including flank information indicating multiple sets of clipping parameters for filtering.

8.前側面情報は、前記複数セットのクリッピングパラメータを含む、第7条項に記載の方法。 8. The method of clause 7, wherein the anterior aspect information includes said plurality of sets of clipping parameters.

9.前記クリッピングパラメータの複数セットは、エンコーダ及びデコーダに知られており、前記サイド情報は、前記クリッピングパラメータの複数セットのうちの1つ又は複数のインデックスを含む、第7条項に記載の方法。 9. The method of clause 7, wherein the multiple sets of clipping parameters are known to the encoder and decoder, and the side information comprises one or more indices of the multiple sets of clipping parameters.

10.前記クリッピングパラメータの前記複数のセットは、ビデオデータユニットまたは前記ビデオユニットのヘッダに含まれる、第7条項に記載の方法。 10. The method of clause 7, wherein said plurality of sets of clipping parameters are contained in a video data unit or a header of said video unit.

11.前記ビデオデータユニットは、適応パラメータセット、タイル群、またはスライスを含む、第10条項に記載の方法。 11. The method of clause 10, wherein said video data units comprise adaptive parameter sets, tiles or slices.

12.第8条に記載の方法であって、データユニット内で信号化されるクリッピングパラメータの複数の組のうちの1組は、データユニット内で信号化されるクリッピングパラメータの別の組によって予測される方法。 12. The method of clause 8, wherein one set of the plurality of sets of clipping parameters signaled within the data unit is predicted by another set of clipping parameters signaled within the data unit. how to be

13.第7条項に記載の方法であって、データユニット内で信号化されるクリッピングパラメータの複数のセットのうちの1つのセットは、別のデータユニット内で信号化されるクリッピングパラメータの別のセットによって予測される方法。 13. The method of Clause 7, wherein one set of the plurality of sets of clipping parameters signaled in a data unit is different from another set of clipping parameters signaled in another data unit. The method predicted by the set.

14.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間で変換を実行するステップを含み、前記コード化表現は、非線形適応ループフィルタを使用して、ビデオ領域のクロマビデオユニットの再構成をフィルタリングするための1つ以上のクリッピングパラメータを提供するサイド情報を含み、前記1つ以上のクリッピングパラメータは、カラーフォーマットに依存する、ビデオ処理方法。 14. Transforming between a coded representation of a video comprising one or more video domains and said video, said coded representation using a non-linear adaptive loop filter to convert chroma video units of video domains. A video processing method comprising side information providing one or more clipping parameters for filtering reconstruction, said one or more clipping parameters being color format dependent.

15.特定のカラーフォーマットに対して、2つのクロマ成分が異なるクリッピングパラメータを使用する、第14条項に記載の方法。 15. The method of clause 14, wherein the two chroma components use different clipping parameters for a particular color format.

16.特定のカラーフォーマットが4:4:4である、第15条項に記載の方法。 16. The method of clause 15, wherein the specified color format is 4:4:4.

17.前記方法は、前記変換中に、前記非線形適応ループフィルタを前記ビデオユニットの再構成に適用し、前記フィルタリングされたビデオユニットを前記ビデオユニットの別のビデオユニットの予測を決定するために使用することによって、フィルタリングされたビデオユニットを生成することをさらに含む、第1条項乃至第16条項のいずれかに記載の方法。 17. The method applies the non-linear adaptive loop filter to reconstruct the video unit during the transform and uses the filtered video unit to determine a prediction of another video unit of the video unit. Clause 16. The method of any of clauses 1-16, further comprising generating the filtered video unit by:

18.1つ以上のビデオ領域を含むビデオのコード化表現と前記ビデオとの間で変換を実行するステップを含み、前記コード化表現は、適応ループフィルタを使用してビデオ領域のビデオユニットの再構成をフィルタリングするためのクリッピングパラメータを提供する側面情報を含み、前記実行するステップは、ビデオ領域レベルでの差異をサンプリングするためにクリッピング動作を適用することによってフィルタリングされたビデオユニットを生成するステップを含むビデオ処理方法。 18. Transforming between a coded representation of a video comprising one or more video regions and said video, said coded representation using an adaptive loop filter to reconstruct video units of said video region. A video comprising aspect information providing clipping parameters for filtering, wherein said performing comprises generating filtered video units by applying a clipping operation to sample differences at the video region level. Processing method.

19.前記ビデオ領域レベルは、シーケンスレベル、ピクチャレベル、スライスレベル、タイル群レベル、タイルレベル、コーディングツリーユニットレベル、コーディングユニットレベル、またはブロックレベルである、第18条項に記載の方法。 19. The method of clause 18, wherein the video region level is sequence level, picture level, slice level, tile group level, tile level, coding tree unit level, coding unit level, or block level.

20.前記クリッピング動作を可能にするための表示は、シーケンスパラメータセット、画像パラメータセット、スライスヘッダ、タイル群ヘッダ、タイル、コーディングツリーユニット、コーディングユニット、またはブロック内で信号化される、第18条項に記載の方法。 20. The indication for enabling said clipping operation is signaled within a sequence parameter set, picture parameter set, slice header, tile group header, tile, coding tree unit, coding unit or block, clause 18 The method described in .

21.前記ビデオ領域は、ビデオ画像である、第1条項乃至第20条項のいずれかに記載の方法。 21. A method according to any of clauses 1-20, wherein said video area is a video image.

22.前記ビデオユニットが、コーディングユニット、変換ユニット、スライス、コーディングツリー、またはコーディングツリー行である、第1条項乃至第20条項のいずれかに記載の方法。 22. The method of any of clauses 1-20, wherein the video unit is a coding unit, transform unit, slice, coding tree, or coding tree row.

23.前記変換の実行は、前記現在のブロックから前記コード化表現を生成することを含む、第1条項乃至第22条項のいずれかに記載の方法。 23. A method according to any of clauses 1-22, wherein said performing a transform comprises generating said coded representation from said current block.

24.前記変換の実行は、前記コード化表現から前記現在のブロックを生成することを含む、第1条項乃至第22条項のいずれかに記載の方法。 24. A method according to any of clauses 1-22, wherein said performing a transform comprises generating said current block from said coded representation.

25.プロセッサと、その上に命令を有する非一時的メモリとを備えるビデオシステム内の装置であって、前記プロセッサによる実行の際に、前記命令は、前記プロセッサに、第1条項乃至第24条項のいずれかに記載の方法を実行させる、装置。 25. Apparatus in a video system comprising a processor and non-transitory memory having instructions thereon, wherein said instructions, upon execution by said processor, cause said processor to perform any of the An apparatus for carrying out the method according to any of

26.非一時的なコンピュータ読取り可能媒体に保管されたコンピュータプログラム製品であって、第1条項乃至第24条項のいずれかに記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。 26. A computer program product stored on a non-transitory computer readable medium, the computer program product containing program code for carrying out the method of any of Clauses 1-24.

以上から、ここにおいて、説明の目的で、本開示の技術の特定の実施形態を説明したが、本発明の範囲を逸脱することなく、種々の修正を行うことができることが理解されるだろう。従って、現在開示されている技術は、添付の特許請求の範囲による場合を除き、限定されない。 From the foregoing, it will be appreciated that although specific embodiments of the disclosed techniques have been described herein for purposes of illustration, various modifications can be made without departing from the scope of the invention. Accordingly, the presently disclosed technology is not limited except as by the appended claims.

この特許文献に記載されている技術的事項の実装および機能動作は、ここにおいて開示されている構造およびそれらの構造的等価物を含む、種々のシステム、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、もしくはハードウェアにおいて、または、それらの1つ以上の組み合わせにおいて実施することができる。ここにおいて説明される技術的事項の実装は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による、または、データ処理装置の動作を制御するための、有形および非一時的なコンピュータ読取り可能媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装することができる。コンピュータ読取可能媒体は、マシンで読取可能ストレージ装置、マシンで読取可能ストレージ基板、メモリ装置、マシンで読取可能伝搬信号に影響を与える事項の組成、または、それらの1つ以上の組み合わせであり得る。用語「データ処理ユニット」または「データ処理装置」は、例えば、プログラマブルプロセッサ、コンピュータ、もしくは、複数のプロセッサまたはコンピュータを含む、データを処理するための全ての装置、装置、およびマシンを包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムの実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、または、それらの1つ以上の組み合わせを構成するコードを含むことができる。 The implementation and functional operation of the technical matter described in this patent document may be implemented in various systems, digital electronic circuits, or computer software, firmware, or software, including the structures disclosed herein and their structural equivalents. Can be implemented in hardware, or in a combination of one or more thereof. Implementation of the technical matter described herein may be implemented in one or more computer program products, i.e., tangible and non-transitory computer-readable media by or for controlling the operation of a data processing apparatus. It can be implemented as one or more modules of computer program instructions encoded above. A computer-readable medium can be a machine-readable storage device, a machine-readable storage substrate, a memory device, a composition of matter that affects a machine-readable propagated signal, or a combination of one or more thereof. The term "data processing unit" or "data processing apparatus" encompasses all devices, devices and machines for processing data including, for example, a programmable processor, computer, or multiple processors or computers. The apparatus, in addition to hardware, contains code that creates an execution environment for the computer program in question, e.g., code that constitutes processor firmware, protocol stacks, database management systems, operating systems, or combinations of one or more thereof. can contain.

コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、または、コードとしても知られるもの)は、コンパイルまたは解釈された言語を含む、任意の形態のプログラミング言語で書くことができ、それは、スタンドアロンプログラムとして、またはコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、または他のユニットとしてのものを含む、任意の形態で展開することができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するものではない。プログラムは、他のプログラムまたはデータを保持するファイルの一部分(例えば、マークアップ言語文書に保管される1つ以上のスクリプト)、問題のプログラム専用の単一ファイル、または、複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部分を保管するファイル)に保管することができる。コンピュータプログラムは、1つのコンピュータまたは1つのサイトに配置されるか、または、複数のサイトに分散され、通信ネットワークによって相互接続される複数のコンピュータ上で実行されるように展開することができる。 A computer program (also known as a program, software, software application, script, or code) can be written in any form of programming language, including compiled or interpreted languages, whether as a stand-alone program, Or they may be deployed in any form, including as modules, components, subroutines or other units suitable for use in a computing environment. A computer program does not necessarily correspond to a file in a file system. A program may be part of a file holding other programs or data (e.g., one or more scripts stored in a markup language document), a single file dedicated to the program in question, or multiple coordinated files ( For example, files that store one or more modules, subprograms, or portions of code). A computer program can be located at one computer or site, or deployed to be executed on multiple computers distributed across multiple sites and interconnected by a communications network.

ここにおいて説明されるプロセスおよび論理フローは、入力データ上で動作し、出力を生成することによって機能を実行するために、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって実行することができる。プロセスおよび論理フローは、また、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)のような特殊目的論理回路によって実行することができ、装置も、また、実行することができる。 The processes and logic flows described herein may be performed by one or more programmable processors executing one or more computer programs to perform functions by operating on input data and generating output. can be done. The processes and logic flows may also be implemented by special purpose logic circuits such as field programmable gate arrays (FPGAs) or application specific integrated circuits (ASICs) and devices may also be implemented.

コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、および、任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般的に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリ、もしくは、その両方から命令およびデータを受信する。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令およびデータを保管するための1つ以上のメモリデバイスである。一般的に、コンピュータは、また、データを保管するための1つ以上の大容量ストレージ装置、例えば、磁気ディスク、磁気光ディスク、または、光ディスクにデータを受信したり、データを転送したりするために動作可能に結合される。しかし、コンピュータは、そのような装置を有する必要はない。コンピュータプログラム命令およびデータを保管するのに適したコンピュータ読取可能媒体は、例えば、EPROM、EEPROM、および、フラッシュメモリデバイスのような半導体メモリデバイスを含む、あらゆる形態の不揮発性メモリ、媒体、または、メモリデバイスを含む。プロセッサおよびメモリは、特殊目的論理回路によって補足されるか、または、内蔵され得る。 Processors suitable for the execution of a computer program include, by way of example, both general and special purpose microprocessors, and any one or more processors of any kind of digital computer. Generally, a processor receives instructions and data from read-only memory and/or random-access memory. The essential elements of a computer are a processor for executing instructions and one or more memory devices for storing instructions and data. Generally, a computer also receives data from, or transfers data to, one or more mass storage devices for storing data, such as magnetic disks, magneto-optical disks, or optical disks. operably coupled. However, a computer need not have such devices. Computer readable media suitable for storing computer program instructions and data include any form of non-volatile memory, medium or memory including, for example, semiconductor memory devices such as EPROM, EEPROM, and flash memory devices. Including devices. The processor and memory may be supplemented by or embedded with special purpose logic circuitry.

本明細書は、図面と共に、単なる例示であるみなされるように意図されており、ここで、例示は実施例を意味する。ここにおいて使用されるように、単数形「a」、「an、」および「the」は、コンテキストが他に明確に示さない限り、複数形も含むように意図されている。さらに、「or」の使用は、コンテキストが他に明確に示さない限り、「and/or」を含むように意図されている。 It is intended that the specification, together with the drawings, be considered as exemplary only, where exemplary means example. As used herein, the singular forms "a," "an," and "the" are intended to include the plural forms as well, unless the context clearly indicates otherwise. Further, the use of "or" is intended to include "and/or" unless the context clearly indicates otherwise.

この特許文献には多くの詳細が含まれているが、これらは、いずれかの発明の範囲または特許請求されることができるものを限定するものではなく、特定の発明の特定の実施形態に特有の特徴の説明として解釈されるべきである。別々の実施形態のコンテキストでこの特許文献に記載されている特定の特徴は、単一の実施形態で組み合わせて実施され得る。反対に、単一の実施形態のコンテキストにおいて説明される種々の特徴は、複数の実施形態において別々に、または、任意の適切なサブコンビネーションで実施され得る。さらに、特徴は、特定の組み合わせにおいて作用するものとして上述され、最初にそのように請求され得るが、請求された組み合わせからの1つ以上の特徴は、場合によって、組み合わせから切り取られてよく、請求された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられ得る。 Although this patent document contains many details, these are not intended to limit the scope of any invention or what may be claimed, but are specific to particular embodiments of particular inventions. should be interpreted as a description of the characteristics of Certain features that are described in this patent document in the context of separate embodiments can be implemented in combination in a single embodiment. Conversely, various features that are described in the context of a single embodiment can also be implemented in multiple embodiments separately or in any suitable subcombination. Further, although features are described above as working in a particular combination, and may initially be claimed as such, one or more features from the claimed combination may optionally be cut from the combination and claimed as such. The combinations presented may be directed to subcombinations or variations of subcombinations.

同様に、図面には特定の順序で動作が示されているが、これは、所望の結果を達成するために、このような動作を特定の順序または連続的な順序で実行すること、もしくは、例示された全ての動作を実行することを要求するものとして理解されるべきではない。さらに、この特許文献に記載されている実施形態における種々のシステム構成要素の分離は、全ての実施形態においてそうした分離を必要とするものとして理解されるべきではない。 Similarly, although the figures show acts in a particular order, this does not mean that such acts must be performed in a particular order or sequential order to achieve a desired result; It should not be understood as requiring that all illustrated acts be performed. Furthermore, the separation of various system components in the embodiments described in this patent document should not be understood as requiring such separation in all embodiments.

少数の実装および実施例のみが記述されており、そして、他の実施形態、拡張、および変形が、この特許文献に記載され、説明されている内容に基づいて行われ得る。 Only a few implementations and examples are described, and other embodiments, extensions, and variations may be made based on what is described and illustrated in this patent document.

Claims (18)

ビデオデータを処理する方法であって、
非線形フィルタリング動作がビデオの現在のビデオ領域に適用されることを決定するステップと、
前記現在のビデオ領域に対する少なくとも1つの第1フィルタリングインデックスを導出するステップと、
前記少なくとも1つの第1フィルタリングインデックスに基づいて、クリッピングパラメータセットから1つ以上の第1クリッピングパラメータを導出するステップと、
前記非線形フィルタリング動作の一部であるクリッピング動作を実行するステップと、
前記クリッピング動作に基づいて、前記現在のビデオ領域と前記ビデオのビットストリームとの間で変換を実行するステップと、を含み、
前記クリッピングパラメータセットは、ビット深度に基づいて構成されている、
方法。
A method of processing video data, comprising:
determining that a non-linear filtering operation is to be applied to a current video region of the video;
deriving at least one first filtering index for the current video region;
deriving one or more first clipping parameters from a clipping parameter set based on the at least one first filtering index;
performing a clipping operation that is part of said non-linear filtering operation;
performing a conversion between the current video region and the video bitstream based on the clipping operation;
wherein the clipping parameter set is configured based on bit depth;
Method.
シフト動作は、前記クリッピングパラメータセットのクリッピングパラメータ値を導出するために使用される、
請求項1に記載の方法。
shift operations are used to derive clipping parameter values for the clipping parameter set;
The method of claim 1.
前記クリッピングパラメータセットは、さらに、クリッピングインデックスに基づいて構成される、
請求項1または2に記載の方法。
the clipping parameter set is further configured based on a clipping index;
3. A method according to claim 1 or 2.
前記クリッピングインデックスは、前記ビットストリーム内のフィールドと関連付けられている、
請求項3に記載の方法。
the clipping index is associated with a field within the bitstream;
4. The method of claim 3.
前記クリッピングインデックスは、既定の規則を使用して決定される、
請求項3または4に記載の方法。
the clipping index is determined using a predefined rule;
5. A method according to claim 3 or 4.
前記クリッピングパラメータセットに対して、前記クリッピングインデックスの所与の値の下で、異なるクリッピングパラメータ値が、異なるビット深度に対して使用される、
請求項3乃至5いずれか一項に記載の方法。
For the clipping parameter set, under a given value of the clipping index, different clipping parameter values are used for different bit depths.
6. A method according to any one of claims 3-5.
所与のビット深度に対する第1クリッピングインデックスに対応する第1クリッピングパラメータ値は、別のビット深度に対する前記第1クリッピングインデックスに対応する第2クリッピングパラメータ値に基づいて導出される、
請求項3乃至6いずれか一項に記載の方法。
a first clipping parameter value corresponding to a first clipping index for a given bit depth is derived based on a second clipping parameter value corresponding to said first clipping index for another bit depth;
7. A method according to any one of claims 3-6.
前記第1クリッピングパラメータ値は、前記第2クリッピングパラメータ値にシフト動作を適用することに基づいて導出される、
請求項7に記載の方法。
the first clipping parameter value is derived based on applying a shift operation to the second clipping parameter value;
8. The method of claim 7.
前記少なくとも1つの第1フィルタリングインデックスは、異なる方向における複数のサンプルの差異に基づいて導出される、
請求項1乃至8いずれか一項に記載の方法。
wherein the at least one first filtering index is derived based on differences of multiple samples in different directions;
9. A method according to any one of claims 1-8.
前記現在のビデオ領域は、複数のM×M個のビデオ領域へ分割され、
異なる方向における前記複数のサンプルの差異は、M×M個のビデオサブ領域毎に導出され、
Mは、2または4に等しく、かつ、前記現在のビデオ領域は、コーディングツリーブロックまたはスライスである、
請求項9に記載の方法。
the current video region is divided into a plurality of M×M video regions;
differences of the plurality of samples in different directions are derived for each M×M video sub-regions;
M is equal to 2 or 4, and the current video region is a coding tree block or slice;
10. The method of claim 9.
異なる方向における前記複数のサンプルの差異は、1:Nのサブサンプリングレートに基づいて導出され、
Nは、1より大きい、
請求項10に記載の方法。
the difference of the plurality of samples in different directions is derived based on a 1:N sub-sampling rate;
N is greater than 1;
11. The method of claim 10.
前記1つ以上の第1フィルタリングパラメータは、さらに、
前記少なくとも1つの第1フィルタリングインデックスに基づいて導出される、
請求項1乃至11いずれか一項に記載の方法。
The one or more first filtering parameters further comprise:
derived based on the at least one first filtering index;
12. A method according to any one of claims 1-11.
前記1つ以上の第1フィルタリングパラメータおよび前記1つ以上の第1クリッピングパラメータは、同一の適応パラメータセットの特定に基づいて導出される、
請求項12に記載の方法。
the one or more first filtering parameters and the one or more first clipping parameters are derived based on identification of the same adaptive parameter set;
13. The method of claim 12.
前記変換は、前記現在のビデオ領域を前記ビットストリームへと符号化することを含む、
請求項1乃至13いずれか一項に記載の方法。
the transforming includes encoding the current video region into the bitstream;
14. The method of any one of claims 1-13.
前記変換は、前記ビットストリームから前記現在のビデオ領域を復号することを含む、
請求項1乃至13いずれか一項に記載の方法。
the transforming includes decoding the current video region from the bitstream;
14. The method of any one of claims 1-13.
ビデオデータを処理するための装置であって、
プロセッサ、および、命令を含む非一時的なメモリ、を含み、
前記プロセッサによって前記命令が実行されると、前記プロセッサに、
非線形フィルタリング動作がビデオの現在のビデオ領域に適用されることを決定し、
前記現在のビデオ領域に対する少なくとも1つの第1フィルタリングインデックスを導出し、
前記少なくとも1つの第1フィルタリングインデックスに基づいて、クリッピングパラメータセットから1つ以上の第1クリッピングパラメータを導出し、
非線形フィルタリング動作の一部であるクリッピング動作を実行し、
前記クリッピング動作に基づいて、前記現在のビデオ領域と前記ビデオのビットストリームとの間で変換を実行する、
ようにさせ、
前記クリッピングパラメータセットは、ビット深度に基づいて構成されている、
装置。
An apparatus for processing video data, comprising:
including a processor and non-transitory memory containing instructions;
Upon execution of the instructions by the processor, to the processor:
determine that a non-linear filtering operation is to be applied to the current video region of the video;
deriving at least one first filtering index for the current video region;
Deriving one or more first clipping parameters from a clipping parameter set based on the at least one first filtering index;
perform a clipping operation that is part of the non-linear filtering operation,
performing a conversion between the current video region and a bitstream of the video based on the clipping operation;
let me
wherein the clipping parameter set is configured based on bit depth;
Device.
命令を保管する非一時的なコンピュータ読取り可能な記憶媒体であって、
プロセッサに、
非線形フィルタリング動作がビデオの現在のビデオ領域に適用されることを決定し、
前記現在のビデオ領域に対する少なくとも1つの第1フィルタリングインデックスを導出し、
前記少なくとも1つの第1フィルタリングインデックスに基づいて、クリッピングパラメータセットから1つ以上の第1クリッピングパラメータを導出し、
非線形フィルタリング動作の一部であるクリッピング動作を実行し、
前記クリッピング動作に基づいて、前記現在のビデオ領域と前記ビデオのビットストリームとの間で変換を実行する、
ようにさせ、
前記クリッピングパラメータセットは、ビット深度に基づいて構成されている、
非一時的なコンピュータ読取り可能な記憶媒体。
A non-transitory computer-readable storage medium for storing instructions,
to the processor,
determine that a non-linear filtering operation is to be applied to the current video region of the video;
deriving at least one first filtering index for the current video region;
Deriving one or more first clipping parameters from a clipping parameter set based on the at least one first filtering index;
perform a clipping operation that is part of the non-linear filtering operation,
performing a conversion between the current video region and a bitstream of the video based on the clipping operation;
let me
wherein the clipping parameter set is configured based on bit depth;
A non-transitory computer-readable storage medium.
ビデオ処理装置によって実行される方法によって生成されたビデオのビットストリームを保管する非一時的コンピュータ読取り可能な記憶媒体であって、
前記方法は、
非線形フィルタリング動作がビデオの現在のビデオ領域に適用されることを決定するステップと、
前記現在のビデオ領域に対する少なくとも1つの第1フィルタリングインデックスを導出するステップと、
前記少なくとも1つの第1フィルタリングインデックスに基づいて、クリッピングパラメータセットから1つ以上の第1クリッピングパラメータを導出するステップと、
前記非線形フィルタリング動作の一部であるクリッピング動作を実行するステップと、
前記クリッピング動作に基づいて、前記現在のビデオ領域と前記ビデオのビットストリームとの間で変換を実行するステップと、を含み、
前記クリッピングパラメータセットは、ビット深度に基づいて構成されている、
非一時的コンピュータ読取り可能な記憶媒体。
A non-transitory computer-readable storage medium storing a video bitstream generated by a method performed by a video processing device, comprising:
The method includes:
determining that a non-linear filtering operation is to be applied to a current video region of the video;
deriving at least one first filtering index for the current video region;
deriving one or more first clipping parameters from a clipping parameter set based on the at least one first filtering index;
performing a clipping operation that is part of said non-linear filtering operation;
performing a conversion between the current video region and the video bitstream based on the clipping operation;
wherein the clipping parameter set is configured based on bit depth;
A non-transitory computer-readable storage medium.
JP2021556952A 2019-03-24 2020-03-24 Nonlinear adaptive loop filtering in video processing Active JP7234406B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023026362A JP7490102B2 (en) 2019-03-24 2023-02-22 Nonlinear adaptive loop filtering in video processing.

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/079395 2019-03-24
CN2019079395 2019-03-24
PCT/CN2020/080827 WO2020192644A1 (en) 2019-03-24 2020-03-24 Nonlinear adaptive loop filtering in video processing

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023026362A Division JP7490102B2 (en) 2019-03-24 2023-02-22 Nonlinear adaptive loop filtering in video processing.

Publications (3)

Publication Number Publication Date
JP2022528051A JP2022528051A (en) 2022-06-08
JPWO2020192644A5 true JPWO2020192644A5 (en) 2022-08-05
JP7234406B2 JP7234406B2 (en) 2023-03-07

Family

ID=72609728

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2021556952A Active JP7234406B2 (en) 2019-03-24 2020-03-24 Nonlinear adaptive loop filtering in video processing
JP2021556953A Active JP7233565B2 (en) 2019-03-24 2020-03-24 Multi-parameter adaptive loop filtering in video processing
JP2023026362A Active JP7490102B2 (en) 2019-03-24 2023-02-22 Nonlinear adaptive loop filtering in video processing.

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021556953A Active JP7233565B2 (en) 2019-03-24 2020-03-24 Multi-parameter adaptive loop filtering in video processing
JP2023026362A Active JP7490102B2 (en) 2019-03-24 2023-02-22 Nonlinear adaptive loop filtering in video processing.

Country Status (12)

Country Link
US (3) US11509941B2 (en)
EP (2) EP3925226A4 (en)
JP (3) JP7234406B2 (en)
KR (2) KR102606010B1 (en)
CN (4) CN115767107A (en)
AU (1) AU2020248837B2 (en)
BR (1) BR112021018509A2 (en)
CA (1) CA3134075A1 (en)
MX (1) MX2021011247A (en)
SG (1) SG11202110102YA (en)
WO (2) WO2020192644A1 (en)
ZA (1) ZA202106908B (en)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7234406B2 (en) 2019-03-24 2023-03-07 北京字節跳動網絡技術有限公司 Nonlinear adaptive loop filtering in video processing
US11368684B2 (en) * 2019-04-23 2022-06-21 Qualcomm Incorporated Adaptation parameter sets (APS) for adaptive loop filter (ALF) parameters
WO2020244571A1 (en) 2019-06-04 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction using neighboring block information
CN114097228B (en) 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 Motion candidate list with geometric partition mode coding
CN113766248B (en) * 2019-06-25 2022-10-18 北京大学 Method and device for loop filtering
KR102669852B1 (en) 2019-07-09 2024-05-29 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Sample determination for adaptive loop filtering
CA3146773A1 (en) 2019-07-11 2021-01-14 Beijing Bytedance Network Technology Co., Ltd. Sample padding in adaptive loop filtering
KR20220030995A (en) 2019-07-14 2022-03-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Transform block size limit in video coding
CN114175637B (en) 2019-07-15 2024-04-12 北京字节跳动网络技术有限公司 Classification in adaptive loop filtering
EP4014497A4 (en) 2019-09-14 2022-11-30 ByteDance Inc. Quantization parameter for chroma deblocking filtering
WO2021052453A1 (en) 2019-09-18 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Two-part signaling of adaptive loop filters in video coding
WO2021052508A1 (en) 2019-09-22 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Padding process in adaptive loop filtering
CN114450954B (en) 2019-09-27 2024-06-25 北京字节跳动网络技术有限公司 Adaptive loop filtering between different video units
CN114450959B (en) 2019-09-28 2024-08-02 北京字节跳动网络技术有限公司 Geometric partitioning modes in video coding and decoding
CN114651442A (en) 2019-10-09 2022-06-21 字节跳动有限公司 Cross-component adaptive loop filtering in video coding and decoding
KR20220071203A (en) 2019-10-10 2022-05-31 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Padding process at sample locations unavailable in adaptive loop filtering
KR20220073745A (en) 2019-10-14 2022-06-03 바이트댄스 아이엔씨 Co-coding of chroma residuals and filtering in video processing
EP4042692A4 (en) 2019-10-29 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. Cross-component adaptive loop filter
KR20220106116A (en) 2019-12-09 2022-07-28 바이트댄스 아이엔씨 Using quantization groups in video coding
MX2022006734A (en) 2019-12-11 2022-06-09 Beijing Bytedance Network Tech Co Ltd Sample padding for cross-component adaptive loop filtering.
CN114902657A (en) 2019-12-31 2022-08-12 字节跳动有限公司 Adaptive color transform in video coding and decoding
EP4173290A4 (en) 2020-06-30 2024-01-10 Beijing Bytedance Network Technology Co., Ltd. Boundary location for adaptive loop filtering
US12075034B2 (en) * 2020-07-24 2024-08-27 Qualcomm Incorporated Multiple adaptive loop filter sets
US12113987B2 (en) * 2020-12-22 2024-10-08 Qualcomm Incorporated Multi-pass decoder-side motion vector refinement
US11838522B2 (en) * 2020-12-29 2023-12-05 Tencent America LLC Method and apparatus for video coding
WO2024208275A1 (en) * 2023-04-07 2024-10-10 Douyin Vision Co., Ltd Using chroma related side information for adaptive loop filter in video coding

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050119422A (en) 2004-06-16 2005-12-21 삼성전자주식회사 Method and apparatus for estimating noise of input image based on motion compenstion and, method for eliminating noise of input image and for encoding video using noise estimation method, and recording medium for storing a program to implement the method
GB2421593B (en) * 2004-12-22 2009-05-27 Stephen Paul Maslen Combined digital and analogue controller for servo control or open loop control system
US8324953B1 (en) * 2009-10-21 2012-12-04 Vyycore Ltd. Method and a system for signal processing
US9094658B2 (en) 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US9438881B2 (en) 2010-07-19 2016-09-06 Dolby Laboratories Licensing Corporation Enhancement methods for sampled and multiplexed image and video data
US9596447B2 (en) * 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
WO2012122425A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Bitdepth and color scalable video coding
CN103460699B (en) * 2011-03-30 2017-06-20 Lg电子株式会社 Loop circuit filtering method and its equipment
PL2882190T3 (en) * 2011-04-21 2019-04-30 Hfi Innovation Inc Method and apparatus for improved in-loop filtering
US20130107973A1 (en) 2011-10-28 2013-05-02 Qualcomm Incorporated Loop filtering control over tile boundaries
US9538200B2 (en) 2012-01-19 2017-01-03 Qualcomm Incorporated Signaling of deblocking filter parameters in video coding
RU2584501C1 (en) 2012-04-16 2016-05-20 Нокиа Текнолоджиз Ой Method and device for video coding
US10575021B2 (en) 2012-07-03 2020-02-25 Telefonaktiebolaget Lm Ericsson (Publ) Controlling deblocking filtering
WO2014015032A2 (en) * 2012-07-19 2014-01-23 Cypress Semiconductor Corporation Touchscreen data processing
US9445130B2 (en) 2013-01-09 2016-09-13 Qualcomm Incorporated Blockiness metric for large HEVC block artifacts
CN105164549B (en) * 2013-03-15 2019-07-02 优步技术公司 Method, system and the equipment of more sensing stereoscopic visions for robot
KR20140116992A (en) * 2013-03-25 2014-10-07 삼성전자주식회사 Apparatus and method of in loop filtering based on largest coding unit for decreasing bandwidth of external memory access
US9712834B2 (en) * 2013-10-01 2017-07-18 Dolby Laboratories Licensing Corporation Hardware efficient sparse FIR filtering in video codec
US10158836B2 (en) * 2015-01-30 2018-12-18 Qualcomm Incorporated Clipping for cross-component prediction and adaptive color transform for video coding
US10057574B2 (en) 2015-02-11 2018-08-21 Qualcomm Incorporated Coding tree unit (CTU) level adaptive loop filter (ALF)
WO2016167538A1 (en) 2015-04-12 2016-10-20 엘지전자(주) Method for encoding and decoding video signal, and apparatus therefor
WO2017045101A1 (en) * 2015-09-14 2017-03-23 Mediatek Singapore Pte. Ltd. Advanced deblocking filter in video coding
US11563938B2 (en) 2016-02-15 2023-01-24 Qualcomm Incorporated Geometric transforms for filters for video coding
US20180041778A1 (en) * 2016-08-02 2018-02-08 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
EP3297282A1 (en) 2016-09-15 2018-03-21 Thomson Licensing Method and apparatus for video coding with adaptive clipping
US20180091812A1 (en) * 2016-09-23 2018-03-29 Apple Inc. Video compression system providing selection of deblocking filters parameters based on bit-depth of video data
WO2018070914A1 (en) 2016-10-12 2018-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Residual refinement of color components
US10506230B2 (en) 2017-01-04 2019-12-10 Qualcomm Incorporated Modified adaptive loop filter temporal prediction for temporal scalability support
WO2018135830A1 (en) * 2017-01-20 2018-07-26 세종대학교 산학협력단 Image encoding method/device, image decoding method/device and recording medium having bitstream stored thereon
US10212456B2 (en) * 2017-06-02 2019-02-19 Apple Inc. Deblocking filter for high dynamic range (HDR) video
CN117793378A (en) * 2017-06-29 2024-03-29 杜比实验室特许公司 Integrated image shaping and video coding
US10778974B2 (en) 2017-07-05 2020-09-15 Qualcomm Incorporated Adaptive loop filter with enhanced classification methods
US11641488B2 (en) 2017-11-01 2023-05-02 Vid Scale, Inc. Methods for simplifying adaptive loop filter in video coding
US10721469B2 (en) 2017-11-28 2020-07-21 Qualcomm Incorporated Line buffer reduction for adaptive loop filtering in video coding
US20190238845A1 (en) 2018-01-26 2019-08-01 Qualcomm Incorporated Adaptive loop filtering on deblocking filter results in video coding
US20190306502A1 (en) 2018-04-02 2019-10-03 Qualcomm Incorporated System and method for improved adaptive loop filtering
CN113383554B (en) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 Interaction between LUTs and shared Merge lists
JP7234406B2 (en) 2019-03-24 2023-03-07 北京字節跳動網絡技術有限公司 Nonlinear adaptive loop filtering in video processing

Similar Documents

Publication Publication Date Title
JP7234406B2 (en) Nonlinear adaptive loop filtering in video processing
JP7425241B2 (en) Video encoding and decoding based on bidirectional optical flow
JPWO2020192644A5 (en)
JPWO2020192645A5 (en)
CN115244924A (en) Signaling across component adaptive loop filters
TW201625002A (en) QP derivation and offset for adaptive color transform in video coding
CN113785576A (en) Use of quadratic transforms in codec video
CN112997500A (en) Improvements to region-based adaptive loop filters
US11546595B2 (en) Sub-block based use of transform skip mode
US20240137574A1 (en) Adaptive bilateral filter in video coding
US20240137573A1 (en) Bilateral filter in video coding
RU2812618C2 (en) Nonlinear adaptive contour filtering in video data processing