JP7543301B2 - 境界平滑化された動き補償に基づくオプティカルフローによるビデオ符号化および復号化の方法および装置 - Google Patents
境界平滑化された動き補償に基づくオプティカルフローによるビデオ符号化および復号化の方法および装置 Download PDFInfo
- Publication number
- JP7543301B2 JP7543301B2 JP2021557967A JP2021557967A JP7543301B2 JP 7543301 B2 JP7543301 B2 JP 7543301B2 JP 2021557967 A JP2021557967 A JP 2021557967A JP 2021557967 A JP2021557967 A JP 2021557967A JP 7543301 B2 JP7543301 B2 JP 7543301B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- motion information
- motion
- sub
- optical flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033001 locomotion Effects 0.000 title claims description 283
- 238000000034 method Methods 0.000 title claims description 135
- 230000003287 optical effect Effects 0.000 title claims description 88
- 238000007670 refining Methods 0.000 claims description 19
- 230000011664 signaling Effects 0.000 claims description 13
- 230000001364 causal effect Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 99
- 230000008569 process Effects 0.000 description 52
- 230000015654 memory Effects 0.000 description 32
- 238000004891 communication Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 15
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 241000023320 Luma <angiosperm> Species 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/583—Motion compensation with overlapping blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
- MC:動き補償(ブロックまたはサブブロックのいずれか)、
- LIC:局所照明補償。線形適応を使用して、予測サンプル値を変更する。
- BIOまたはBDOF:双方向予測オプティカルフロー。ブロックを再構築するために使用される2つの参照ブロック間のオプティカルフロー推定の結果を使用して、予測されるサンプル値を変更する。このツールの詳細については、以下で説明する。
- DMVR:復号化器側の動きベクトル精緻化(図3には示されていない):双方向予測のために復号化器側のPU内の動きベクトルを精緻化。
- GBI一般化双予測、CUレベルの重み付きBCW双予測とも呼ばれる:ブロックを再構築するために使用される2つの参照ブロックの重み付け平均。
- OBMC:オーバーラップしたブロック動き補償。隣接するブロックからの異なる動きベクトルを使用して、動き補償ブロックの重み付け平均。このツールの詳細については、以下で説明する。
- IQ/IT:残差を再構築するために使用される逆量子化と変換。
- イントラ予測:周囲のサンプル値を使用してブロックを予測するための使用。
- Multi-HypothesisまたはCIIP Combined Inter/Intra Prediction:位置に応じて重み付け平均を使用して、いくつかの予測(通常はインターとイントラ)を統合する。また、ブロック内でいくつかのインター予測をマージすることができる三角形のmulti-hypothesisにも拡張される。
- CCLM:クロスコンポーネントリニアモデル。別の既に再構築されたコンポーネントを使用して、線形モデルを使用して現在のコンポーネントを予測する。
- 現在のブロックCは、現在のブロックの動きベクトルで第1の動きを補償され、
- 現在のブロックCの左バンドは、左ブロック隣接Lの動きベクトルで補償され、
- 現在のブロックCの上バンドは、上ブロックの隣接するT0およびT1の動きベクトルを使用して補償され、
- 次いで、最終動き補償ブロックを計算するために、(ブロックレベルまたは画素レベルのいずれかで)重み付け和が実行される。
1)CUの高さは4ではなく、CUは4×8のサイズではなく、
2)CUは、アフィンモードまたはsbTMVPマージモードを使用してコード化されず、
3)CUは、「真の」双予測モードを使用してコード化され、すなわち、2つの参照ピクチャのうちの1つは、表示順に現在のピクチャの前にあり、他方は、表示順に現在のピクチャの後にある。
ステップ1)サブブロックベースのアフィン動き補償を実行して、サブブロック予測I(i,j)を生成する。
ステップ2)サブブロック予測の空間勾配gx(i,j)およびgy(i,j)は、3タップフィルタ[-1,0,1]を使用して、各サンプル位置で計算される。
gx(i,j)=I(i+1,j)-I(i-1,j)
gy(i,j)=I(i,j+1)-I(i,j-1)
サブブロック予測は、勾配計算のために両側に1画素延長される。メモリ帯域幅と複雑性を低減するために、拡張されたボーダー上の画素は、参照ピクチャの最も近い整数画素位置からコピーされる。したがって、埋め込み領域に対する追加の補間は回避される。
ステップ3)輝度予測精緻化は、オプティカルフロー方程式により算出する。
ΔI(i,j)=gx(i,j)*Δvx(i,j)+gy(i,j)*Δvy(i,j)
ここで、Δv(i,j)は、図6に示すように、v(i,j)で示されるサンプル位置(i,j)について計算される画素MVと、画素(i,j)が属するサブブロックのサブブロックMV VSBとの差である。アフィンモデルのパラメータおよびサブブロック中心に対する画素位置はサブブロックからサブブロックに変更されないため、第1のサブブロックについてΔv(i,j)を算出し、同じCU内の他のサブブロックについて再利用することができる。xおよびyを画素位置からサブブロックの中心までの水平および垂直オフセットとすると、Δv(x,y)は以下の式で導出することができ、
ステップ4)最後に、サブブロック予測I(i,j)に輝度予測精緻化を追加する。最終予測I’は、I’(i,j)=I(i,j)+ΔI(i,j)として生成される。
- 動き情報のみを使用することによって、境界ブロック上のオプティカルフロー予測精緻化を導出し、
- いくつかの固定条件に基づいて条件付きでこの精緻化を適用するか、または精緻化の適用を信号通知し、
- CU、サブブロック(4×4)、またはより大きなブロック(16×16)レベルでの精緻化を適用する。
- 各サブブロックB0~B6について、ステップS111で、現在のサブブロックの現在mvC、上mvT、および左mvL動きベクトルが抽出される。以下では、mv抽出または検索のための様々な実施形態が開示される。
- ステップS112において、例えば、サブブロックB0を有する図12に例示されるように、現在のサブブロックB内の各画素について、新しい動きベクトルmv(i,j)は、3つの動きベクトルmvC、mvTおよびmvL:mv(i,j)=a(i,j)*mvC(i,j)+b(i,j)*mvT(i,j)+c(i,J)*mvL(i,j)の重み付け和として計算される。以下では、重み付け係数を取得するための様々な実施形態が開示される。
- ステップS113では、次いで、サブブロックの各画素に対してオプティカルフローベースの精緻化が実行される。図14は、特定の実施形態による、位置(i,j)での画素の境界平滑化された動き補償に基づくオプティカルフローのフローチャートを図示する。
o サブブロックについての空間勾配gx(I,j)およびgy(I,j)が計算される。勾配は、CU内の因果ボーダーの各サブブロックに対して動き補償を1画素拡大することによって計算される。勾配を計算するためのいくつかの変形によれば、
■ ブロックの外側の画素について最も近い画素動き補償は、複雑な補間フィルタを有利に回避するために実行される。
■ 現在のサブブロックにサブブロックの動きベクトルがない(すなわち、SbTMVPのアフィンではない)場合、サブブロックの外側の右ボーダーと下ボーダーは、CU内の隣接するサブブロックからコピーされる。
o 動きベクトル差は、Δmv(i,j)=mv(i,j)-mvC(i,j)で計算される。
o 精緻化は、ΔI(i,j)=Δmv(i,j)_x*gx(i,j)+Δmv(i,j)_y*gy(i,j)から計算され、ここで、Iは現在の予測画像であり、Δmv(i,j)_xおよびΔmv(i,j)_yは、動きベクトル差Δmv(i,j)のxおよびy成分である。
o 精緻化された予測は、クリップされた精緻化を予測に追加することによって得られる:I(i,j)←I(i,j)+clip(ΔI(i,j))。
■ クリッピング機能を使用すると、大きな勾配や動きの場合に精緻化の補正を制限できる。通常、クリップ関数は次のようになる:
・ Clip(x):if x<-T then return T else if x>T return T lese return x.
・ 閾値Tは固定されている。典型的な値は、10ビット信号の場合8である。
したがって、オプティカルフローベースのOMBCを使用して、精緻化されたインター予測Iが得られる。
- ダークレー、0.5の重み
- ライトグレー、0.25の重み
- ホワイト、0の重み
w(i,j)=W|1-1/K(i-i0)|if i<i0+K
w(i,j)=0 otherwise
ここで、i0は上行の座標であり、Wはスケールファクタであり、Kはサブブロック内部の平滑化の長さである。例えば、W=1、K=2を取ると、次のようになる。
w(i0,j)=1
w(i0+1,j)=1/2
w(i0+2,j)=0
w(i0+3,j)=0
ボーダーから中央までの任意の他の減少重み付け関数を使用することができる。
- 予測の動き補償(つまりMCおよびLICの間)の直後、
- LICなどの補正ツールによって予測が変更された後(つまりLIC,BDOF、BCWまたはOBMCの後)。
- CUサイズ(表面または長さのいずれか)が閾値より大きい、
- プロセスがアクティブかどうかを示すフラグがCUにコード化されている。フラグは、他のレベル(CTU、スライス)に設定でき得る。
- 一部のモード(マージモードなど)では、動き予測器のフラグ値を使用してフラグが推測される。
・ 復号化器および/または符号化器に適用されるインター予測プロセスを修正すること。
・ 復号化器および/または符号化器内の境界ブロックの動き情報を使用してオプティカルフロー予測精緻化を導出すること。
・ 現在のブロックの動きベクトル、上隣接ブロックの動きベクトル、左隣接ブロックの動きベクトル、および復号化器および/または符号化器内の動きベクトル重み付け係数から、オーバーラップしたブロック動き精緻化に基づくオプティカルフローで使用される精緻化された動きベクトルを決定すること。
・ 復号化器および/または符号化器内で、オーバーラップしたブロック動きの精緻化に基づくオプティカルフローで使用される動きベクトル重み付け係数を導出すること。
・ 復号化器および/または符号化器内のオーバーラップしたブロック動作精緻化に基づくオプティカルフローを有効にすること。
・ 復号化器が、オーバーラップしたブロック動作の精緻化に基づくオプティカルフローを識別し、インター予測で使用することを可能にする信号通知構文要素を挿入すること。
・ 復号化器および/または符号化器内のCU、サブブロック(4×4)、またはより大きなブロック(例えば16×16)レベルで、オーバーラップしたブロック動きに基づくオプティカルフローの精緻化を有効にすること。
・ 復号化器が、オーバーラップしたブロック動き精緻化に基づくオプティカルフローが適用されるCU、サブブロック、またはブロックを識別することを可能にする信号通知構文要素を挿入すること。
・ これらの構文要素に基づいて、オプティカルフローベースのオーバーラップしたブロック動き精緻化を選択して、復号化器に適用すること。
・ 記載された構文要素またはその変形のうちの1つ以上を含むビットストリームまたは信号。
・ 記載された実施形態のいずれかに従って生成された情報を伝達する構文を含むビットストリームまたは信号。
・ 記載された構文要素、またはそれらの変形の1つ以上を含むビットストリームもしくは信号を作成および/または送信および/または受信および/または復号化すること。
・ 記載される実施形態のいずれかに従って、作成および/または送信および/または受信および/または復号化すること。
・ 記載される実施形態のいずれかに係る方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、または信号。
・ 記載される実施形態のいずれかに従って、重複ブロック動作精緻化に基づくオプティカルフローを実行する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・ 記載された実施形態のいずれかに従ってオーバーラップしたブロック動き精緻化に基づくオプティカルフローを実行し、結果として生じる画像を(例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して)表示する、テレビ、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
・ テレビ、セットトップボックス、携帯電話、タブレット、または符号化された画像を含む信号を受信するためにチャネルを選択し(例えば、チューナを使用して)、記載された実施形態のいずれかに従ってオーバーラップしたブロック動き精緻化に基づくオプティカルフローを実行する、他の電子デバイス。
・ テレビ、セットトップボックス、携帯電話、タブレット、または符号化された画像を含む信号、および記載される実施形態のいずれかに従って、オーバーラップしたブロック動き精緻化に基づいたオプティカルフローを受信する(例えば、アンテナを使用して)、他の電子デバイス。
Claims (12)
- インター予測精緻化(S100)により画像ブロックを復号化するための方法であって、
前記ブロックについての動き情報、上隣接ブロックについての動き情報、左隣接ブロックについての動き情報を取得すること(S111)と、
動き情報重み付け係数を使用した、前記ブロックについての動き情報、前記上隣接ブロックについての動き情報、および前記左隣接ブロックについての動き情報の重み付け和から、前記ブロックについての新しい動き情報を取得すること(S112)と、
前記ブロックについての前記新しい動き情報を用いて、オプティカルフローを適用することによって、前記画像ブロックのインター予測を精緻化すること(S113)と、
を含む、方法。 - インター予測精緻化(S100)により画像ブロックを符号化するための方法であって、
前記ブロックについての動き情報、上隣接ブロックについての動き情報、左隣接ブロックについての動き情報を取得すること(S111)と、
動き情報重み付け係数を使用した、前記ブロックについての動き情報、前記上隣接ブロックについての動き情報、および前記左隣接ブロックについての動き情報の重み付け和から、前記ブロックについての新しい動き情報を取得すること(S112)と、
前記ブロックについての前記新しい動き情報を用いて、オプティカルフローを適用することによって、前記画像ブロックのインター予測を精緻化すること(S113)と、
を含む、方法。 - インター予測精緻化(S100)により画像ブロックを復号化するための装置であって、
前記ブロックについての動き情報、上隣接ブロックについての動き情報、左隣接ブロックについての動き情報を取得するための手段と、
動き情報重み付け係数を使用した、前記ブロックについての動き情報、前記上隣接ブロックについての動き情報、および前記左隣接ブロックについての動き情報の重み付け和から、前記ブロックについての新しい動き情報を取得するための手段と、
前記ブロックについての前記新しい動き情報を用いて、オプティカルフローを適用することによって、前記画像ブロックのインター予測を精緻化する(S113)ための手段と、
を備える、装置。 - インター予測精緻化(S100)により画像ブロックを符号化するための装置であって、
前記ブロックについての動き情報、上隣接ブロックについての動き情報、左隣接ブロックについての動き情報を取得するための手段と、
動き情報重み付け係数を使用した、前記ブロックについての動き情報、前記上隣接ブロックについての動き情報、および前記左隣接ブロックについての動き情報の重み付け和から、前記ブロックについての新しい動き情報を取得するための手段と、
前記ブロックについての前記新しい動き情報を用いて、オプティカルフローを適用することによって、前記画像ブロックのインター予測を精緻化する(S113)ための手段と、
を備える、装置。 - 前記インター予測精緻化は、前記画像ブロックの因果ボーダーの境界サブブロックについて実行される、請求項1,2のうちいずれか一項に記載の方法。
- 前記画像ブロックが、サブブロック動きフィールドを有し、前記インター予測精緻化が、前記画像ブロックの任意のサブブロックについて実行される、請求項1,2のうちいずれか一項に記載の方法。
- 前記取得することは、下隣接ブロックについての動き情報および右隣接ブロックについての動き情報のうちの少なくとも1つを取得することを含み、
前記取得することは、前記下隣接ブロックについての動き情報および前記右隣接ブロックについての動き情報のうちの少なくとも1つについての動き情報の重み付け和から、前記ブロックについての前記新しい動き情報を取得することを含む、請求項1,2,5,6のいずれか一項に記載の方法。 - 前記画像ブロックが、サブブロック動きフィールドを有し、
前記精緻化することは、前記サブブロック動きフィールドを更に用いて、オプティカルフローを適用することによって、前記画像ブロックのインター予測を精緻化することを含む、請求項1,2,5,6,7のいずれか一項に記載の方法。 - 前記画像ブロックの前記インター予測精緻化が、ある値よりも大きい前記ブロックのサイズに応答するか、または前記ブロックのインター予測モードに応答して、ブロックレベルまたはサブブロックレベルで有効になる、請求項1,2,5,6,7,8のいずれか一項に記載の方法。
- 前記画像ブロックの前記インター予測精緻化が、前記インター予測精緻化が適用される前記ブロックまたはサブブロックを識別することを可能にするフラグを信号通知構文要素に挿入することによって、ブロックレベル、サブブロックレベルで有効になる、請求項1,2,5,6,7,8のいずれか一項に記載の方法。
- 前記動き情報重み付け係数が、前記インター予測精緻化が実行されるブロックのピクセルと前記上および左隣接ブロックとの間の距離に基づいて導出される、請求項1,2のいずれか一項に記載の方法。
- 1つ以上のプロセッサによって実行されたときに、請求項1、2および5~11のいずれか一項に記載の方法を実行するためのコンピューティング命令を備えるコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19305508 | 2019-04-18 | ||
EP19305508.4 | 2019-04-18 | ||
PCT/US2020/028074 WO2020214564A1 (en) | 2019-04-18 | 2020-04-14 | Method and apparatus for video encoding and decoding with optical flow based on boundary smoothed motion compensation |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022529104A JP2022529104A (ja) | 2022-06-17 |
JPWO2020214564A5 JPWO2020214564A5 (ja) | 2023-04-18 |
JP7543301B2 true JP7543301B2 (ja) | 2024-09-02 |
Family
ID=67437263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021557967A Active JP7543301B2 (ja) | 2019-04-18 | 2020-04-14 | 境界平滑化された動き補償に基づくオプティカルフローによるビデオ符号化および復号化の方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11991389B2 (ja) |
EP (1) | EP3957073A1 (ja) |
JP (1) | JP7543301B2 (ja) |
CN (1) | CN113875253A (ja) |
MX (1) | MX2021012698A (ja) |
WO (1) | WO2020214564A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11736720B2 (en) * | 2019-09-03 | 2023-08-22 | Tencent America LLC | Motion vector refinement methods for video encoding |
WO2021262037A1 (en) * | 2020-06-22 | 2021-12-30 | Huawei Technologies Co., Ltd. | Motion compensation with a sparse optical flow representation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180262773A1 (en) | 2017-03-13 | 2018-09-13 | Qualcomm Incorporated | Inter prediction refinement based on bi-directional optical flow (bio) |
WO2018171796A1 (en) | 2017-03-24 | 2018-09-27 | Mediatek Inc. | Method and apparatus of bi-directional optical flow for overlapped block motion compensation in video coding |
-
2020
- 2020-04-14 MX MX2021012698A patent/MX2021012698A/es unknown
- 2020-04-14 CN CN202080038228.3A patent/CN113875253A/zh active Pending
- 2020-04-14 US US17/603,644 patent/US11991389B2/en active Active
- 2020-04-14 WO PCT/US2020/028074 patent/WO2020214564A1/en active Application Filing
- 2020-04-14 EP EP20724285.0A patent/EP3957073A1/en active Pending
- 2020-04-14 JP JP2021557967A patent/JP7543301B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180262773A1 (en) | 2017-03-13 | 2018-09-13 | Qualcomm Incorporated | Inter prediction refinement based on bi-directional optical flow (bio) |
WO2018171796A1 (en) | 2017-03-24 | 2018-09-27 | Mediatek Inc. | Method and apparatus of bi-directional optical flow for overlapped block motion compensation in video coding |
Non-Patent Citations (2)
Title |
---|
Jiancong (Daniel) Luo, and Yuwen He,CE2-related: Prediction refinement with optical flow for affine mode,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-N0236-r5,14th Meeting: Geneva, CH,2019年03月,pp.1-7 |
Wei Chen, and Yuwen He,Non-CE9: Block Boundary Prediction Refinement with Optical Flow for DMVR,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-O0581,15th Meeting: Gothenburg,2019年07月,pp.1-3 |
Also Published As
Publication number | Publication date |
---|---|
MX2021012698A (es) | 2021-11-12 |
EP3957073A1 (en) | 2022-02-23 |
US20220201328A1 (en) | 2022-06-23 |
US11991389B2 (en) | 2024-05-21 |
CN113875253A (zh) | 2021-12-31 |
WO2020214564A1 (en) | 2020-10-22 |
JP2022529104A (ja) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11722694B2 (en) | Method and apparatus for video encoding and decoding based on a linear model responsive to neighboring samples | |
US20230164314A1 (en) | Method and apparatus for deblocking an image | |
CN113170146B (zh) | 用于图片编码和解码的方法和设备 | |
US20220159277A1 (en) | Method and apparatus for video encoding and decoding with subblock based local illumination compensation | |
JP7548908B2 (ja) | 重み付け予測に適応された双方向オプティカルフローによる映像符号化及び復号の方法及び装置 | |
JP7502278B2 (ja) | 双予測を使用するビデオエンコーディングおよびデコーディングのための方法および装置 | |
JP2024075598A (ja) | 一般化された双予測および重み付き予測 | |
KR20210089747A (ko) | 비디오 인코딩 및 디코딩을 위한 가상 파이프라인 | |
CN117597933A (zh) | 空间局部光照补偿 | |
JP2024023456A (ja) | コード化/復号化におけるデータ依存関係 | |
JP7543301B2 (ja) | 境界平滑化された動き補償に基づくオプティカルフローによるビデオ符号化および復号化の方法および装置 | |
US11563975B2 (en) | Motion compensation boundary filtering | |
KR20220123666A (ko) | 가중-예측 파라미터들의 추정 | |
EP3751850A1 (en) | Motion compensation boundary filtering | |
CN118975246A (zh) | 对视频画面数据进行编码/解码 | |
KR20220052991A (ko) | 스위칭가능한 보간 필터들 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231226 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240724 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7543301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |