JP7386977B2 - テンソル積bスプライン予測子 - Google Patents
テンソル積bスプライン予測子 Download PDFInfo
- Publication number
- JP7386977B2 JP7386977B2 JP2022520205A JP2022520205A JP7386977B2 JP 7386977 B2 JP7386977 B2 JP 7386977B2 JP 2022520205 A JP2022520205 A JP 2022520205A JP 2022520205 A JP2022520205 A JP 2022520205A JP 7386977 B2 JP7386977 B2 JP 7386977B2
- Authority
- JP
- Japan
- Prior art keywords
- tpb
- images
- spline
- basis functions
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006870 function Effects 0.000 claims description 219
- 238000000034 method Methods 0.000 claims description 91
- 238000013507 mapping Methods 0.000 claims description 60
- 230000000007 visual effect Effects 0.000 claims description 25
- 238000003860 storage Methods 0.000 claims description 20
- 238000009877 rendering Methods 0.000 claims description 7
- 241000023320 Luma <angiosperm> Species 0.000 description 43
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 43
- 239000011159 matrix material Substances 0.000 description 26
- 238000012545 processing Methods 0.000 description 25
- 238000004891 communication Methods 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 16
- 238000011144 upstream manufacturing Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 238000013459 approach Methods 0.000 description 11
- 239000002356 single layer Substances 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000005284 basis set Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Prostheses (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Color Television Systems (AREA)
Description
本願は、2019年10月1日に出願された米国仮特許出願第62/908770号及び2019年10月1日に出願された欧州特許出願第19200793.8号の優先権を主張し、該出願のそれぞれは、参照によりその全体が本明細書に組み込まれる。
本明細書では、テンソル積Bスプライン(TPB)予測子を説明する。本明細書で説明する技術は、ビデオコンテンツ処理パイプラインにおいて予測動作を行い、下流のビデオコンテンツプロセッサが、第1のダイナミックレンジ(例えば、HDR、SDR等)のビデオコンテンツをビデオ信号で運ばれる第2の異なるダイナミックレンジ(例えば、SDR、HDR等)のデコードされたビデオコンテンツから再構成することができるように上流ビデオコンテンツプロセッサを用いてコンポーザーメタデータ(composer metadata)を作成するために用いることができる。一部の動作シナリオでは、コンポーザーメタデータは、単一チャンネルルーマ予測子及び単一の(例えば、可能な入力ルミナンス及びクロミナンス符号語の一部又は全てに適用可能な)多チャンネル多重回帰(MMR)クロマ予測子を用いて作成され得る。単一チャンネルルーマ予測子は、同じ輝度を有するピクセルに対する彩度を制限し得る。単一のMMRは、グローバルマッピングを適用することにより局所的な色の予測を制限する。これらの制限は、再構成又はマッピングされた画像(mapped image)の精度を低下させ、色の精度をより不正確にし、カラーチャート(例えば、表現又は測定される全ての可能な色の一部又は全てを含む)の一部の部分(例えば、鮮やかな色、高度に飽和した色等)について比較的大きな色差を生じさせ得る。例示の単一チャンネルルーマ予測及びMMRクロマ予測動作は、2018年12月18日に出願された米国仮特許出願第62/781185号に記載されており、その内容の全体は、それが本明細書に完全に記載されているかのように参照により本願に組み込まれる。
図1Aは、ビデオキャプチャ/生成からHDR又はSDRディスプレイまでの様々な段階を示す、ビデオ配信パイプライン(100)の例示のプロセスを示す。HDRディスプレイの例としては、限定されないが、テレビ、モバイル装置、ホームシアター等と共に動作する画像ディスプレイが挙げられる。SDRディスプレイの例としては、限定されないが、SDRテレビ、モバイル装置、ホームシアターディスプレイ、ヘッドマウントディスプレイ装置、ウェアラブルディスプレイ装置等が挙げられる。
一部の動作シナリオでは、HDR表示装置上へのレンダリングのためにSDRコンテンツを強化するためにSDR+を用いることができる。SDR画像のルーマチャンネル及びクロマチャンネル(又は色空間コンポーネント)は、(マップ)HDR画像の対応するルーマ及びクロマチャンネルを生成するためにコンポーザーメタデータ等の画像メタデータを用いて別々にマッピングされ得る。
第1及び第2のエンコーダ側アーキテクチャの両方では、ビデオ信号内の画像メタデータ(152)におけるTPBコンポーザーメタデータは、下流の受信機がHDRターゲットディスプレイのために、(ビデオ信号にエンコードされた)SDR画像(117)を再構築画像(又は逆方向再整形画像)に逆方向再整形できるように用いることができる。HDRターゲットディスプレイの例としては、HDRリファレンスディスプレイと同様の表示能力を有するHDRターゲットディスプレイ、HDRリファレンスディスプレイとは異なる表示能力を有するHDRターゲットディスプレイ、HDRターゲットディスプレイのためのビデオコンテンツを表示するために、HDRリファレンスディスプレイのための再構築ビデオコンテンツをマッピングする追加のDM動作を伴うHDRターゲットディスプレイ等のいずれかが挙げられるが、必ずしもこれらのみに限定されない。
TPB(ベースの)予測は、同じ視覚的な意味内容を描写する異なるカラーグレードの間で又はうちでのマッピング又は変換の選択された動作パラメータを導出するために用いられ得る。本明細書で用いるカラーグレードとは、ビデオ画像の(例えば、リリース、専門的にカラーグレードされた、ユーザ又はビデオ専門家によってカラーグレードされた、再構築された、予測すべき)バージョンを意味し得る。
[外1]
及び
[外2]
が、j番目のSDR及びHDR画像におけるi番目の画素についての正規化されたY、C0(例えば、Cb等)及びC1(例えば、Cr等)の値をそれぞれ表すものとする。ルーマ又は輝度チャンネルについて、
[外3]
から
[外4]
を予測するために、単一チャンネルのBスプライン予測子が用いられ得る。
[外5]
と表記されるDy(=T+n-1)Bスプライン基底関数の完全なセットを構築するために用いられ得る。HDR輝度符号語値
[外3]
からのSDR輝度符号語値の単一チャンネル予測
[外6]
は、対応する係数
[外7]
のセットを用いて以下のように行われ得る。
[外8]
及びBスプライン基底関数
[外9]
は、対応する(入力)HDR輝度符号語値
[外10]
から(ターゲット)SDR輝度符号語値
[外11]
を予測するために、以下のようにマトリクスの形態に集めることができる。
[外13]
が比較的疎らな(sparse)シナリオを考慮に入れるために、特別な注意が払われ得る。どのような種類の信号又は画素のデータ分布であるかにかかわらず、ノット点が予め選択され得るか又は固定され得る動作シナリオでは、隣接するノット間のノット間隔に画素が存在しないか又は空であり得る。Bスプライン基底関数は比較的小さな間隔でしか正でないか又はサポートされず、間隔の外ではゼロであるため、画素が存在しないかもしれない空の間隔は、
[外13]
においていくつかの又は全てのゼロ列(それぞれが全てのゼロを含む)をもたらし得る。そのようなゼロ列は、マトリクス
[外14]
の計算を不明瞭にし得るか又は特異性に遭遇し得る。一部の動作シナリオでは、この問題を解決するか又は改善するために、
[外13]
において全ゼロであるか又は(例えば、プログラムによって、経験的に又はユーザによって設定された数値閾値と比べて)全てが比較的小さな値の場合、対応する係数
[外8]
をゼロに設定され得る。
における各要素を
[外15]
で示し、α番目の列を
[外16]
で示す。全てがゼロ値又は全てが比較的小さい値(例えば、列内の合計が数値的閾値を下回る、列内の各マトリクス要素が数値的閾値を下回る等)の列を除外してデザインマトリックスを再構築する例示の手順を以下の表2に示す。
[外7]
と共にノット又はノット点{kt}の位置(及び/又は総数)は、全体的な最小化(又は最適化)問題又は解の一部として適応的に決定され得る。
一部の動作シナリオでは、単一チャンネル(又は1D)のBスプライン予測子等の単一チャンネル予測子を用いてHDRとSDRとの間(その逆)のマッピングを生成するには、比較的大きな制限があり得る。1DのBスプライン予測子は、他のアプローチ(例えば、累積分布関数又はCDFに基づくアプローチ、最小平均二乗誤差又はMMSEに基づくアプローチ等)と同等の予測性能及び精度を提供し得るが、追加の計算複雑性が伴う可能性がある。ビデオコンテンツの異なるカラーグレードに対するマッピングの問題は、多次元色空間(例えば、RGB、IPT、YDzDx及びYCbCr等の3D色空間、色空間における3つ以上のチャンネル等)にあり、一部の動作シナリオでは1D機能又は予測は制限を受け得る。例えば、HDRとSDR(前後)との間の比較的正確なマッピングは、色変換及び彩度制御等の(カラーグレーディングの専門家によって手動で実行されるものと同様の)クロスカラー動作を含み得る。そのため、1D予測子を用いて、異なる輝度レベルでの色、色相及び彩度の人間の知覚を伴う多次元色空間におけるこのマッピングの問題を解決するのは最適でないかもしれない。
[外18]
[外19]
及び
[外20]
がそれぞれある。ここで、jはj番目のSDR及びHDR画像を示し、tyはルーマ又は輝度Y次元のためのBスプライン基底関数インデックス(Y次元に沿ったノット点のセットを与える)、tc0はクロマ又はクロミナンスC0次元のためのBスプライン基底関数インデックス(C0次元に沿ったノット点のセットが与えらる)を示し、tc1はクロマ又はクロミナンスC1次元のためのBスプライン基底関数インデックス(C1次元に沿ったノット点のセットが与えらる)を示し、iはSDR及びHDR画像のそれぞれのPピクセル間の画素インデックスを示す。
[外18]
[外19]
及び
[外20]
におけるBスプライン基底関数の総数をそれぞれD0 y、D1 y及びD2 yで示す。3次元のそれぞれにおけるノット点の各セットが与えられ、Bスプライン基底関数の3つの完全なセット
[外18]
[外19]
及び
[外20]
における各セットは、上記の式(3)を用いて構築され得る。
[外18]
[外19]
及び
[外20]
のベクトル積を取ることにより構築できる。ty、tc0とtc1の固有の組み合わせを表す(3D)TPBインデックスを持つTPB基底関数は以下のように与えられ得るか又は計算され得る。
[外3]
[外21]
及び
[外22]
からのSDR輝度符号語値のクロスチャンネル予測
[外6]
は対応する係数のセット
[外23]
を用いて以下のように行われ得る。
[外24]
及びクロスチャンネルTPB関数
[外25]
は、対応する(入力)HDR輝度及びクロミナンス符号語値
[外26]
から(ターゲット)SDR輝度符号語値
[外11]
を予測するために、以下のようにマトリクスの形態に集めることができる。
[外28]
[外29]
及び
[外30]
が構築され得る。Bスプライン基底関数の3つの完全なセットの総数は、D0 c、D1 c及びD2 cであり得る。3つの次元にノット点のセットを与えることで、3つの個別の基底関数セット
[外28]
[外29]
及び
[外30]
ができる。
[外31]
及びクロスチャンネルTPB関数
[外32]
は、対応する(入力)HDR輝度及びクロミナンス符号語値
[外26]
から(ターゲット)SDR輝度符号語値
[外33]
を予測するために、以下のようにマトリクスの形態に集めることができる。
[外34]
と共に、TPBクロスチャンネル予測のための全体的な最小化(又は最適化)の問題又は解の一部として適応的に決定され得る。
[外35]
マトリクスが計算され、異なるチャンネル又は次元のために異なるSマトリクスを計算する必要ない。次に、各チャンネルのためのクロスチャンネル予測符号語値は、同じSマトリクスを対応する予測パラメータ/係数で乗じることによって以下のように得ることができる。
エクステリアノット点を含むノット又はノット点が均一に分布する場合、Bスプライン基底関数は打ち切り多項式の線形結合によって表すことができる。n次の打ち切り多項式は次のように定義され得る。
[外36]
は、[kt-1 kt+1]範囲の間で又は2hの間隔でのみ正であるか又サポートされ、そうでなければ、この範囲外ではゼロ(0)である。式(36)に示すように、一次Bスプライン基底関数は、それぞれが入力値(例えば、参照符号語等を近似するターゲット符号語を予測するために用いられる入力又はソース符号語等)とそれぞれのノット点との差で乗算したそれぞれのノット乗算係数(ciと表記され、iは、0と2との間の整数を表す)を含む3つの項を含む。例えば、式(36)の第1項の第1のノット乗算係数は
[外37]
であり、式(36)の第2項の第2のノット乗算係数は
[外38]
であり、式(36)の第3項の第3のノット乗算係数は
[外37]
である。
[外39]
は、[kt-1 kt+2]範囲の間で又は3hの間隔でのみ正であるか又サポートされ、そうでなければ、この範囲外ではゼロ(0)である。式(37)に示すように、二次Bスプライン基底関数は、それぞれが入力値(例えば、参照符号語等を近似するターゲット符号語を予測するために用いられる入力又はソース符号語等)とそれぞれのノット点との差で乗算したそれぞれのノット乗算係数(ciと表記され、iは、0と3との間の整数を表す)を含む4つの項を含む。例えば、式(37)の第1項の第1のノット乗算係数は
[外40]
であり、式(37)の第2項の第2のノット乗算係数は―
[外41]
であり、式(37)の第3項の第3のノット乗算係数は
[外31]
であり、式(37)の第4項の第4のノット乗算係数は
[外40]
である。
[外42]
は、[kt-1 kt+2]範囲の間で又は4hの間隔でのみ正であるか又サポートされ、そうでなければ、この範囲外ではゼロ(0)である。式(38)に示すように、三次Bスプライン基底関数は、それぞれが入力値(例えば、参照符号語等を近似するターゲット符号語を予測するために用いられる入力又はソース符号語等)とそれぞれのノット点との差で乗算したそれぞれのノット乗算係数(ciと表記され、iは、0と4との間の整数を表す)を含む5つの項を含む。例えば、式(38)の第1項の第1のノット乗算係数は
[外43]
であり、式(38)の第2項の第2のノット乗算係数は―
[外44]
であり、式(38)の第3項の第3のノット乗算係数は
[外45]
であり、式(38)の第4項の第4のノット乗算係数は
[外44]
であり、式(38)の第5項の第5のノット乗算係数は
[外43]
である。
[外46]
は、(n+1)h間隔を交差させることにより正である。点xが与えられた場合、(n+1)基底関数のみが、点xをカバーする範囲にわたってサポートを又は正である可能性のある値を含む。その結果、これらの(n+1)基底関数のみが所与の点xのためにアクティブになる。所与の点xは残りの基底関数が非ゼロの範囲外にあるため、所与の点xでは、残りの基底関数はゼロ(0)である。3つのカラーチャンネル又は次元のTPB基底関数を構築するために、全てのBスプライン基底関数ではなく、むしろ(n+1)3Bスプライン基底関数のみがアクティブになる。これは、Bスプライン基底関数の(元の)総数(Dy=D0 y・D1 y・D2 y)からの潜在的に多数の乗算を大幅に低減する。
図1Bは、1つ以上のコンピュータプロセッサを有するビデオコンテンツプロセッサ(例えば、デコーダ、エンコーダ、トランスコーダ等)で実施され得る、TPBクロスチャンネル予測のための例示の処理ブロックを示す。これらの処理ブロックの一部又は全部は、ハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組み合わせで実施され得る。
[外46]
を準備し、Yチャンネル又は次元で各基底関数からDyの異なる値を出力し、Cbチャンネル又は次元で各基底関数からDcbの異なる値を出力し、Crチャンネル又は次元で各基底関数からDcrの異なる値を出力するTPB基底生成演算を含む。各チャンネル又は次元には(n+1)の非ゼロ値しかないため、非ゼロ信号又は値のみを出力すれば、3チャンネル又は寸法からは3*(n+1)の非ゼロ信号又は値しかない。このブロックにおける動作は、Bスプライン基底関数のノット点が予め設定されているか、固定されているか又は利用可能である限り、ビデオコンテンツ又は画像メタデータが受信されるのを待つことなく、予め設定されいるか、固定されいるか及び/又は予め実行され得る。
[外47]
で乗算するTPB係数乗算動作を含む。最終予測値
[外6]
[外48]
及び
[外49]
を生成するために、各高次元基底関数を重み付けする(n+1)3の乗法と、全ての値を合計する加算があり、以下のようになる。
[外50]
等)と乗算するために(例えば、エンコーダ生成、上流のビデオコンテンツプロセッサによる生成等)ブロック196に提供される。
一部の動作シナリオでは、TPB予測は、3Dマッピングテーブル(3DMT)技術に基づいて生成される符号語ヒストグラム又は分布を用いて実施され得る。
[外51]
であるとする。ビデオコンテンツの第2のカラーグレードのSDR画像等の第2の画像(第1の画像に対応するか又は第1の画像と同じ視覚的コンテンツを描写する、例えば参照画像等)からのi番目の画素の第2のルーマ及びクロマ符号語を含む第2の3Dアレイが
[外52]
であるとする。
[外53]
[外54]
及び
[外55]
がそれぞれ第2の画像ドメインにおける(参照)ルーマ及びクロマ符号語の合計であるとする。
が、3DヒストグラムΩQ,vのq番目のSDRビンの中央を表すとする。これらの中央の値は第1のカラーグレードの全ての画像のために固定されており、予め計算することができる。中央の値が近似される対応する参照又はターゲットHDR値は、以下の表5に示す例示の手順を用いて得られ得る。
[外57]
。
[外58]
の平均値は、以下の表6に示す例示の手順を用いて計算できる。
[外59]
のTPBクロスチャンネル予測は、以下のように行われる。
[外60]
は、個々の画素ベースの解におけるものと同様の処理を介して得ることができる。設計マトリクス及びターゲットベクトルは、全ての有効な3Dビンについての全てのマッピング対(例えば、上述の式41等)を含むマッピングテーブルから入力値を取ることによって構築できる。
本明細書で説明するTPB予測は、シーンベース、セグメントベース及び/又は線形ベースのエンコーディングアーキテクチャを用いて行われ得る。
TPB予測パラメータ又は係数を含む画像メタデータをエンコード及び/又はデコードするために、広範なシンタックス及びセマンティクスが用いられ得る。TPBパラメータ又は係数を含む画像メタデータをエンコーディング/デコーディングするための例示のシンタックス及びセマンティクスを以下の表10に示す。
-tpb_num_not_minus1[y][x][cmp][k]は、k番目のチャンネルにおける1を差し引いたノットの数を規定する。
-tpb_order_minus1[y][x][cmp][k]は、1を差し引いたTPB次数を規定する。
-tpb_zero_coef[y][x][cmp][i][j][k]は、係数がゼロかどうかを規定する。
-tpb_int[y][x][cmp][i][j][k]は、coefficient_data_type=0の場合にfp_ tpb_coef[y][x][cmp][i][j][k]の整数部分を規定する。coefficient_data_type=1の場合、tpb_int[y][x][cmp][i][j][k]は存在しない。(例えば、fp_tpb_coef[y][x][cmp][i][j][k]は、coefficient_data_type=0の場合に、mapping_idc[y][x][cmp]に関連する対応するTPB基底関数iの重み係数(例えば、mTPB,y,(opt)、mTPB,C0,(opt)、mTPB,C1,(opt)等)を導出するために用いられ得る。)
-tpb_coef[y][x][cmp][i]は、coefficient_data_type=0の場合に、fp_tpb_coef[y][x][cmp][i][j][k]の分数部分を規定する。coefficient_data_type=1の場合、tpb_coef[y][x][cmp][i][j][k]は、mapping_idc[y][x][cmp]に関連する利得係数又は重み係数を導出するために用いられる。coefficient_data_type=0の場合、tpb_coef[y][x][cmp][i][j][k]シンタックス要素の長さは、coefficient_log2_denomビットである。coefficient_data_type=1の場合、tpb_coef[y][x][cmp][i][j][k]シンタックス要素の長さは32ビットである。mapping_idc[y][x][cmp]に関連する正規化における利得係数又は重み係数の値は以下のように導出される。
・coefficient_data_type=0の場合、重み係数又は利得係数の値は、fp_ tpb_coef[y][x][cmp][i][j][k] =(tpb_int[y][x][cmp][i][j][k] << coefficient_log2_denom) + tpb_coef[y][x][cmp][i][j][k]と等しく、ここで、「<<」はシフト演算を表す。
・coefficient_data_type=1の場合、重み付け係数又は利得係数の値はtpb_coef[y][x][cmp][i][j][k]と等しい。
図4Aは、本発明の一実施形態に係る例示のプロセスフローを示す。一部の実施形態では、1つ以上のコンピューティング装置又はコンポーネント(例えば、エンコーディング装置/モジュール、トランスコーディング装置/モジュール、デコーディング装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュール、逆マッピング生成及びアプリケーションシステム等)がこのプロセスフローを行い得る。ブロック402で、画像処理システムはテンソル積Bスプライン(TPB)基底関数のセットを決定する。
本発明の実施形態は、コンピュータシステム、電子回路及びコンポーネントで構成されるシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)、または他の構成可能又はプログラム可能なロジックデバイス(PLD)、離散時間又はデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)等の集積回路(IC)及び/又はこれらのシステム、デバイス又はコンポーネントのうちの1つ以上を含む装置を用いて実施することができる。コンピュータ及び/又はICは、本明細書で説明する、拡張されたダイナミックレンジで画像の適応知覚量子化に関する命令を行うか、制御するか又は実行し得る。コンピュータ及び/又はICは、本明細書で説明する適応知覚量子化プロセスに関連する様々なパラメータ又は値のいずれかを計算し得る。画像及びビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア及びそれらの様々な組み合わせで実施され得る。
上記の詳述では、実施ごとに異なり得る数多くの具体的な詳細を参照して、本発明の実施形態を説明してきた。そのため、本発明のクレームされた実施形態の唯一且つ排他的な指標であって、出願人が意図する本発明のクレームされた実施形態は、本願に由来し、後の訂正を含む、クレームが由来する特定の形式の一式のクレームである。そのようなクレームに含まれる用語について本願において明示的に記載される定義は、クレームで用いられる用語の意味に適用されるものとする。したがって、クレームに明示的に記載されていない限定、要素、特性、特徴、利点又は属性は、そのようなクレームの範囲を決して限定すべきではない。したがって、本明細書及び図面は、制限的な意味ではなく例示的な意味で考えられるべきである。
本発明は、限定されないが、本発明の実施形態のいくつかの部分の構造、特徴及び機能を説明する以下の列挙される例示の実施形態(EEE)を含む、本明細書で説明した形態のいずれかで実施され得る。
テンソル積Bスプライン(TPB)基底関数のセットを決定することと、
ソースカラーグレードの1つ以上のソース画像におけるソース画像データから1つ以上のマッピングされた画像における予測画像データを生成するために、前記TPB基底関数のセットと共に用いられるべき選択されたTPB予測パラメータのセットを生成することであって、該選択されたTPB予測パラメータのセットは、前記1つ以上のマッピングされた画像における予測画像データと、参照カラーグレードの1つ以上の参照画像における参照画像データとの間の差を最小化することによって生成され、該1つ以上の参照画像は前記1つ以上のソース画像に対応し、前記1つ以上のソース画像によって描写されるものと同じ視覚コンテンツを描写する、ことと、
前記選択されたTPB予測パラメータのセットを、前記1つ以上のソース画像におけるソース画像データと共に画像メタデータの一部としてビデオ信号にエンコードすることと、
前記1つ以上のマッピングされた画像が前記ビデオ信号の受信装置で再構築及びレンダリングされるようにすることと、
を含む方法。
前記ソース画像データ又は前記参照画像データの少なくとも1つは、色空間のサブサンプリング形式で表される、EEE1の方法。
前記1つ以上のソース画像は、メディアプログラムにおける視覚シーンを構成する画像、スライディングウィンドウ内で選択される画像又は線形セグメント内で選択される画像のうちの1つを表す、EEE1又は2の方法。
前記TPB基底関数のセットは、Bスプライン基底関数の1つ以上のセットのテンソル積により生成され、該Bスプライン基底関数の1つ以上のセットの各うちのBスプライン基底関数の各セットは、色空間の1つ以上のカラーチャンネルにおけるそれぞれのカラーチャンネルに対応する、EEE1乃至3のいずれかの方法。
前記Bスプライン基底関数の1つ以上のセットのうちのBスプライン基底関数の少なくとも1つのセットは、特定の次数のBスプライン基底関数の完全なセットを表す、EEE4の方法。
前記Bスプライン基底関数の1つ以上のセットは、打ち切り多項式及び均一に分布されたノット点のセットを用いて生成されたBスプライン基底関数のセットを含む、EEE4又は5の方法。
前記選択されたTPB予測パラメータのセットと前記TPB基底関数のセットとの組み合わせは、前記1つ以上のマッピングされた画像における前記予測画像データを生成するためのクロスチャンネル予測子を表す、EEE1乃至6のいずれかの方法。
前記TPB予測パラメータのセットは複数のマッピング対を用いて生成され、該複数のマッピング対のそれぞれは、前記ソース画像データから生成された1つ以上のソース符号語の第1のアレイと、前記参照画像データから生成された1つ以上の参照符号語の第2のアレイとを含む、EEE1乃至7のいずれかの方法。
前記複数のマッピング対は、3次元マッピングテーブル(3DMT)に基づいて生成される、EEE8の方法。
第1のカラーグレードの1つ以上の第1の画像を、ビデオ信号からデコーディングすることと、
テンソル積Bスプライン(TPB)基底関数のセットと乗算するための選択されたTPB予測パラメータのセットを含む画像メタデータを、前記ビデオ信号からデコーディングすることと、
前記TPB基底関数のセットと共に前記TPB予測パラメータのセットを用いて、前記1つ以上の第1の画像から1つ以上のマッピングされた画像を生成することと、
前記1つ以上のマッピングされた画像から導出された1つ以上の表示画像がディスプレイ装置でレンダリングされるようにすることと、
を含む方法。
選択されたTPB予測パラメータのセットは、上流のビデオコンテンツプロセッサによって生成されたものであり、前記選択されたTPB予測パラメータのセットは、第1のカラーグレードの1つ以上の第1の画像における第1の画像データから1つ以上のマッピングされた画像データにおける予測画像データを生成するために、前記TPB基底関数のセットと共に用いられるべきものであり、前記上流のビデオコンテンツプロセッサは、前記1つ以上のマッピングされた画像における予測画像データと、参照カラーグレードの1つ以上の参照画像における参照画像データとの間の差を最小化することにより、前記選択されたTPB予測パラメータのセットを生成し、前記1つ以上の参照画像は、前記1つ以上の第1の画像に対応し、前記1つ以上の第1の画像によって描写されるものと同じ視覚コンテンツを描写する、EEE10の方法。
複数のBスプライン基底関数出力値を生成することと、
前記複数のBスプライン基底関数出力値にクロス積演算を適用して複数のTPB基底関数出力値を生成することにより、複数のTPB基底関数出力値のセットを生成することと、
前記ビデオ信号からデコードされた前記TPB予測パラメータのセットを、前記複数のTPB基底関数出力値のセットで乗算して、予測符号語のセットを生成することと、
をさらに含む、EEE10の方法。
複数のBスプライン基底関数出力値を生成することは、
複数のBスプライン基底関数における各Bスプライン基底関数について、各Bスプライン基底関数を表すために打ち切り多項式で用いるべきノット点及び対応する倍数因子を決定することと、
前記1つ以上の第1の画像におけるデコードされた符号語を前記打ち切り多項式の入力として用いて、各Bスプライン基底関数のための出力値を生成することと、
を含む、EEE12の方法。
前記複数のBスプライン基底関数出力値をローカルレジスタに記憶することと、
前記TPB基底関数における各TPB基底関数について、前記複数のBスプライン基底関数出力値のうちの、色空間の各チャンネルにおける(n+1)の非ゼロBスプライン基底関数出力値を特定することであって、nは、複数のBスプライン基底関数の次数を示す、ことと、
前記(n+1)の非ゼロBスプライン基底関数出力値を入力の一部として用いて、前記1つ以上の第1の画像におけるデコードされた符号語から、各TPB基底関数のための出力値を生成することと、
をさらに含む、EEE12の方法。
前記1つ以上の第1の画像における各デコードされた符号語について、前記1つ以上のマッピングされた画像における出力符号語を、
前記出力符号語をゼロに開始すること(initiating)と、
前記TPB基底関数における各TPB基底関数について、
色空間の3つのチャンネルにおける各チャンネルのために(n+1)の非ゼロBスプライン基底関数出力値を生成することにより、(n+1)の非ゼロBスプライン基底関数出力値の3つのセットを生成することであって、nは前記複数のBスプライン基底関数の次数を示す、ことと、
(n+1)の非ゼロBスプライン基底関数出力値の3つのセットにクロス積演算を適用して、前記1つ以上の画像における前記デコードされた符号語からTPB基底関数出力値を生成することと、
前記TPB基底関数出力値を前記TPB予測パラメータのセットにおける対応する予測パラメータで乗算することにより積を生成することと、
前記積を出力符号語に加えることと、
を行うことと、
を行うことにより、生成すること、
をさらに含む、EEE12の方法。
前記選択されたTPB予測パラメータのセットはコーディングシンタックスにおいて複数の重み係数としてエンコードされ、該コーディングシンタックスは、前記TPB基底関数のセットにおける対応するTPB基底関数のために、前記複数の重み係数におけるそれぞれの重み係数を運ぶのをサポートする、EEE10乃至15のいずれかの方法。
EEE1乃至EEE16に記載の方法のいずれか1つを実行するように構成されたコンピュータシステム。
プロセッサを含み、EEE1乃至EEE16に記載の方法のいずれか1つを行うように構成された装置。
EEE1乃至EEE16に記載の方法のいずれかに従って方法を実行するためのコンピュータ実行可能命令が記憶された非一時的コンピュータ読み取り可能記憶媒体。
Claims (20)
- ソースカラーグレードの1つ以上のソース画像におけるソース画像データから、1つ以上のマッピングされた画像の少なくとも1つのカラーチャンネルの予測画像データを生成するために予測パラメータのセットを生成することであって、該1つ以上のマッピングされた画像は、M個(M>1)のカラーチャンネルを含み、
前記少なくとも1つのカラーチャンネルのための前記予測パラメータのセットを生成することは、
Bスプライン基底関数のM個のセットのテンソル積に対応するテンソル積Bスプライン(TPB)基底関数のセットを決定することと、
前記ソースカラーグレードの前記1つ以上のソース画像における前記ソース画像データから前記1つ以上のマッピングされた画像の前記少なくとも1つのカラーチャンネルの予測画像データを生成するために、前記TPB基底関数のセットと共に用いられるべき選択されたTPB予測パラメータのセットを、前記少なくとも1つのカラーチャンネルのための前記予測パラメータのセットとして生成することであって、該選択されたTPB予測パラメータのセットは、前記1つ以上のマッピングされた画像の前記少なくとも1つのカラーチャンネルの予測画像データと、参照カラーグレードの1つ以上の参照画像における参照画像データとの間の差を最小化することによって生成され、該1つ以上の参照画像は前記1つ以上のソース画像に対応し、前記1つ以上のソース画像によって描写されるものと同じ視覚コンテンツを描写する、ことと、
を含む、ことと、
前記選択されたTPB予測パラメータのセットを、前記1つ以上のソース画像におけるソース画像データと共に画像メタデータの一部としてビデオ信号にエンコードし、該ビデオ信号の受信装置で前記1つ以上のマッピングされた画像の再構築及びレンダリングを可能にすることと、
を含む方法。 - 前記TPB基底関数のセットを決定することは、
前記M個のカラーチャンネルのそれぞれのためにBスプライン基底関数のセットを決定することと、
前記TPB基底関数のセットを、Bスプライン基底関数のセットのそれぞれのテンソル積として決定することと、
を含む、請求項1に記載の方法。 - 前記ソース画像データ又は前記参照画像データの少なくとも1つは、色空間のサブサンプリング形式で表される、請求項1又は2に記載の方法。
- 前記1つ以上のソース画像は、メディアプログラムにおける視覚シーンを構成する画像、スライディングウィンドウ内で選択される画像又は線形セグメント内で選択される画像のうちの1つを表す、請求項1乃至3のいずれかに記載の方法。
- 前記Bスプライン基底関数のセットのうちの少なくとも1つは、特定の次数のBスプライン基底関数の完全なセットを表す、請求項1乃至4のいずれかに記載の方法。
- 前記Bスプライン基底関数のセットのそれぞれは、均一に分布するノット点のセットを用いて生成される、請求項1乃至5のいずれかに記載の方法。
- 前記Bスプライン基底関数のセットのそれぞれは、打ち切り多項式を用いて生成される、請求項1乃至6のいずれかに記載の方法。
- 前記M個のカラーチャンネルのそれぞれのために選択されたTPB予測パラメータのセットが生成され、少なくとも2つのカラーチャンネルの前記選択されたTPB予測パラメータのセットは、同じTPB基底関数のセットを用いて生成される、請求項1乃至7のいずれかに記載の方法。
- 前記選択されたTPB予測パラメータのセットと前記TPB基底関数のセットとの組み合わせは、前記1つ以上のマッピングされた画像における前記予測画像データを生成するためのクロスチャンネル予測子を表す、請求項1乃至8のいずれかに記載の方法。
- 前記TPB予測パラメータのセットは複数のマッピング対を用いて生成され、該複数のマッピング対のそれぞれは、前記ソース画像データから生成された1つ以上のソース符号語の第1のアレイと、前記参照画像データから生成された1つ以上の参照符号語の第2のアレイとを含む、請求項1乃至9のいずれかに記載の方法。
- 前記複数のマッピング対は、3次元マッピングテーブル(3DMT)に基づいて生成される、請求項10に記載の方法。
- 前記ソース画像の画素のソース符号語は固定数のビンに分割され、該ビンのそれぞれについて、それぞれの前記ビンにおける前記ソース画像の画素に対応する参照画像の画素の参照符号語の平均が計算され、前記第1のアレイは、前記ソース符号語のビンの中心値を含み、前記第2のアレイは、前記参照符号語の対応する計算された平均を含む、請求項10又は11に記載の方法。
- 第1のカラーグレードの、M個(M>1)のカラーチャンネルを含む1つ以上の第1の画像を、ビデオ信号からデコーディングすることと、
Bスプライン基底関数のM個のセットのテンソル積に対応するTPB基底関数のセットにアクセスすることと、
テンソル積Bスプライン(TPB)基底関数のセットと乗算するための選択されたテンソル積Bスプライン(TPB)予測パラメータのセットを含む画像メタデータを、前記ビデオ信号からデコーディングすることと、
前記TPB基底関数のセットと共に前記TPB予測パラメータのセットを用いて、前記1つ以上の第1の画像から1つ以上のマッピングされた画像を生成することと、
前記1つ以上のマッピングされた画像から導出された1つ以上の表示画像がディスプレイ装置でレンダリングされるようにすることと、
を含む方法。 - 複数のBスプライン基底関数出力値を生成することと、
前記複数のBスプライン基底関数出力値にクロス積演算を適用して複数のTPB基底関数出力値を生成することにより、複数のTPB基底関数出力値のセットを生成することと、
前記ビデオ信号からデコードされた前記TPB予測パラメータのセットを、前記複数のTPB基底関数出力値のセットで乗算して、予測符号語のセットを生成することと、
をさらに含む、請求項13に記載の方法。 - 複数のBスプライン基底関数出力値を生成することは、
複数のBスプライン基底関数における各Bスプライン基底関数について、各Bスプライン基底関数を表すために打ち切り多項式で用いるべきノット点及び対応する倍数因子を決定することと、
前記1つ以上の第1の画像におけるデコードされた符号語を前記打ち切り多項式の入力として用いて、各Bスプライン基底関数のための出力値を生成することと、
を含む、請求項14に記載の方法。 - 前記複数のBスプライン基底関数出力値をローカルレジスタに記憶することと、
前記TPB基底関数における各TPB基底関数について、前記複数のBスプライン基底関数出力値のうちの、色空間の各チャンネルにおける(n+1)個の非ゼロBスプライン基底関数出力値を特定することであって、nは、前記複数のBスプライン基底関数の次数を示す、ことと、
前記(n+1)個の非ゼロBスプライン基底関数出力値を入力の一部として用いて、前記1つ以上の第1の画像におけるデコードされた符号語から、各TPB基底関数のための出力値を生成することと、
をさらに含む、請求項14に記載の方法。 - 前記1つ以上の第1の画像における各デコードされた符号語について、前記1つ以上のマッピングされた画像における出力符号語を、
前記出力符号語をゼロに開始することと、
前記TPB基底関数における各TPB基底関数について、
色空間の3つのチャンネルにおける各チャンネルのために(n+1)個の非ゼロBスプライン基底関数出力値を生成することにより、(n+1)個の非ゼロBスプライン基底関数出力値の3つのセットを生成することであって、nは前記複数のBスプライン基底関数の次数を示す、ことと、
(n+1)個の非ゼロBスプライン基底関数出力値の3つのセットにクロス積演算を適用して、前記1つ以上の画像における前記デコードされた符号語からTPB基底関数出力値を生成することと、
前記TPB基底関数出力値に前記TPB予測パラメータのセットにおける対応する予測パラメータを乗算することにより積を生成することと、
前記積を前記出力符号語に加えることと、
を行うことと、
を行うことにより、生成すること、
をさらに含む、請求項14に記載の方法。 - 前記選択されたTPB予測パラメータのセットはコーディングシンタックスにおいて複数の重み係数としてエンコードされ、該コーディングシンタックスは、前記TPB基底関数のセットにおける対応するTPB基底関数のために、前記複数の重み係数におけるそれぞれの重み係数を運ぶのをサポートする、請求項13乃至17のいずれかに記載の方法。
- プロセッサを含み、請求項1乃至18に記載の方法のいずれか1つを行うように構成された装置。
- 請求項1乃至18に記載の方法のいずれかに従って方法を実行するためのコンピュータ実行可能命令が記憶された非一時的コンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962908770P | 2019-10-01 | 2019-10-01 | |
US62/908,770 | 2019-10-01 | ||
EP19200793 | 2019-10-01 | ||
EP19200793.8 | 2019-10-01 | ||
PCT/US2020/053172 WO2021067204A1 (en) | 2019-10-01 | 2020-09-29 | Tensor-product b-spline predictor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022550206A JP2022550206A (ja) | 2022-11-30 |
JP7386977B2 true JP7386977B2 (ja) | 2023-11-27 |
Family
ID=72802182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022520205A Active JP7386977B2 (ja) | 2019-10-01 | 2020-09-29 | テンソル積bスプライン予測子 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11962760B2 (ja) |
EP (1) | EP4038881A1 (ja) |
JP (1) | JP7386977B2 (ja) |
KR (1) | KR20220053657A (ja) |
CN (1) | CN114731426A (ja) |
BR (1) | BR112022006246A2 (ja) |
TW (1) | TWI812874B (ja) |
WO (1) | WO2021067204A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11838531B2 (en) | 2019-12-06 | 2023-12-05 | Dolby Laboratories Licensing Corporation | Cascade prediction |
CN113312821B (zh) * | 2021-06-03 | 2023-01-24 | 西北工业大学 | 一种基于b样条密度法的三维自支撑结构拓扑优化设计方法 |
JP7560701B1 (ja) | 2021-09-09 | 2024-10-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | モバイルアプリケーションにおけるhdrビデオについてのテンソル積bスプライン予測 |
WO2024167857A1 (en) * | 2023-02-10 | 2024-08-15 | Dolby Laboratories Licensing Corporation | Image compression using tensor-product b-spline representation |
WO2024173649A1 (en) * | 2023-02-16 | 2024-08-22 | Dolby Laboratories Licensing Corporation | Local reshaping using tensor-product b-spline with coordinates wide view video |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524371A (ja) | 2006-01-23 | 2009-06-25 | マックス−プランク−ゲゼルシャフト・ツア・フェルデルング・デア・ヴィッセンシャフテン・エー・ファオ | 高ダイナミックレンジコーデック |
JP2014520414A (ja) | 2011-04-14 | 2014-08-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数色チャネル多重回帰予測器 |
JP2015503873A (ja) | 2012-01-03 | 2015-02-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 視覚ダイナミックレンジコード化動作及びパラメータの指定 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU681185B2 (en) * | 1993-10-22 | 1997-08-21 | Sony Corporation | apparatus and method for recording and reproducing digital video data |
US6847737B1 (en) | 1998-03-13 | 2005-01-25 | University Of Houston System | Methods for performing DAF data filtering and padding |
US20050168460A1 (en) | 2002-04-04 | 2005-08-04 | Anshuman Razdan | Three-dimensional digital library system |
KR100819960B1 (ko) | 2002-11-06 | 2008-04-07 | 지오메트릭 인포매틱스 인코퍼레이티드 | 등각 구조에 의한 기하학적 표면의 분석 방법 |
KR101177131B1 (ko) | 2003-03-26 | 2012-08-24 | 티-스플라인즈, 인크. | 국부 정교화를 이용하여 t-스플라인 및 t-nurcc표면을 정의하기 위한 시스템 및 방법 |
US7346736B1 (en) | 2004-12-13 | 2008-03-18 | Sun Microsystems, Inc. | Selecting basis functions to form a regression model for cache performance |
US20060274070A1 (en) | 2005-04-19 | 2006-12-07 | Herman Daniel L | Techniques and workflows for computer graphics animation system |
US8874477B2 (en) | 2005-10-04 | 2014-10-28 | Steven Mark Hoffberg | Multifactorial optimization system and method |
WO2007100900A2 (en) | 2006-02-28 | 2007-09-07 | Ernest Daniel Miller | Color management of digital files and images for printing |
US9572494B2 (en) | 2008-08-12 | 2017-02-21 | New Jersy Institute of Technology | Method and apparatus for multi-spectral imaging and analysis of skin lesions and biological tissues |
JP5506273B2 (ja) | 2009-07-31 | 2014-05-28 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
JP5506272B2 (ja) | 2009-07-31 | 2014-05-28 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
TWI479898B (zh) | 2010-08-25 | 2015-04-01 | Dolby Lab Licensing Corp | 擴展影像動態範圍 |
WO2012122426A1 (en) * | 2011-03-10 | 2012-09-13 | Dolby Laboratories Licensing Corporation | Reference processing for bitdepth and color format scalable video coding |
US8903169B1 (en) | 2011-09-02 | 2014-12-02 | Adobe Systems Incorporated | Automatic adaptation to image processing pipeline |
WO2013090120A1 (en) * | 2011-12-15 | 2013-06-20 | Dolby Laboratories Licensing Corporation | Backwards-compatible delivery of digital cinema content with extended dynamic range |
JP2015519016A (ja) | 2012-05-14 | 2015-07-06 | ロッサト、ルカ | 支持情報に基づく残存量データのエンコードおよび再構成 |
US10536710B2 (en) * | 2012-06-27 | 2020-01-14 | Intel Corporation | Cross-layer cross-channel residual prediction |
EP3272123B1 (en) * | 2015-03-20 | 2019-06-19 | Dolby Laboratories Licensing Corporation | Signal reshaping approximation |
WO2017044499A1 (en) | 2015-09-07 | 2017-03-16 | Sony Interactive Entertainment America Llc | Image regularization and retargeting system |
CN105389775B (zh) * | 2015-10-16 | 2018-08-17 | 浙江工业大学 | 融合图像灰度特征与结构化表示的图像群组配准方法 |
US10210430B2 (en) | 2016-01-26 | 2019-02-19 | Fabula Ai Limited | System and a method for learning features on geometric domains |
CN107182068A (zh) | 2016-03-11 | 2017-09-19 | 索尼公司 | 用于无线通信的装置和方法、参数优化装置和方法 |
CN108885783B (zh) * | 2016-03-23 | 2022-02-15 | 杜比实验室特许公司 | 编码和解码可逆制作质量单层视频信号 |
EP3437190B1 (en) | 2016-03-31 | 2023-09-06 | Cohere Technologies, Inc. | Channel acquisition using orthogonal time frequency space modulated pilot signal |
WO2018231968A1 (en) * | 2017-06-16 | 2018-12-20 | Dolby Laboratories Licensing Corporation | Efficient end-to-end single layer inverse display management coding |
US10192353B1 (en) | 2017-10-10 | 2019-01-29 | 8i Limited | Multiresolution surface representation and compression |
US11322164B2 (en) | 2018-01-18 | 2022-05-03 | Dolby Laboratories Licensing Corporation | Methods and devices for coding soundfield representation signals |
US10262451B1 (en) * | 2018-04-09 | 2019-04-16 | 8i Limited | View-dependent color compression |
EP3900341A1 (en) | 2018-12-18 | 2021-10-27 | Dolby Laboratories Licensing Corporation | Machine learning based dynamic composing in enhanced standard dynamic range video (sdr+) |
-
2020
- 2020-08-19 TW TW109128170A patent/TWI812874B/zh active
- 2020-09-29 BR BR112022006246A patent/BR112022006246A2/pt unknown
- 2020-09-29 EP EP20788964.3A patent/EP4038881A1/en active Pending
- 2020-09-29 WO PCT/US2020/053172 patent/WO2021067204A1/en unknown
- 2020-09-29 JP JP2022520205A patent/JP7386977B2/ja active Active
- 2020-09-29 CN CN202080069195.9A patent/CN114731426A/zh active Pending
- 2020-09-29 KR KR1020227010706A patent/KR20220053657A/ko not_active Application Discontinuation
- 2020-09-29 US US17/764,394 patent/US11962760B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009524371A (ja) | 2006-01-23 | 2009-06-25 | マックス−プランク−ゲゼルシャフト・ツア・フェルデルング・デア・ヴィッセンシャフテン・エー・ファオ | 高ダイナミックレンジコーデック |
US20140086321A1 (en) | 2006-01-23 | 2014-03-27 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | High dynamic range codecs |
JP2014520414A (ja) | 2011-04-14 | 2014-08-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数色チャネル多重回帰予測器 |
JP2015503873A (ja) | 2012-01-03 | 2015-02-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 視覚ダイナミックレンジコード化動作及びパラメータの指定 |
Non-Patent Citations (1)
Title |
---|
Cheung Auyeung 1730 N. First Street San Jose, CA 95112, USA,Color gamut scalable video coding with piecewise linear predictions and shift-offset model[online], JCTVC-N JCTVC-N0271_r1,インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N0271-v2.zip>,2013年07月27日,pp.1-6 |
Also Published As
Publication number | Publication date |
---|---|
BR112022006246A2 (pt) | 2022-06-21 |
US11962760B2 (en) | 2024-04-16 |
KR20220053657A (ko) | 2022-04-29 |
US20220408081A1 (en) | 2022-12-22 |
CN114731426A (zh) | 2022-07-08 |
WO2021067204A1 (en) | 2021-04-08 |
EP4038881A1 (en) | 2022-08-10 |
JP2022550206A (ja) | 2022-11-30 |
TWI812874B (zh) | 2023-08-21 |
TW202116072A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109416832B (zh) | 高效的基于直方图的亮度外观匹配 | |
JP7386977B2 (ja) | テンソル積bスプライン予測子 | |
CN108885783B (zh) | 编码和解码可逆制作质量单层视频信号 | |
JP6609056B2 (ja) | 高ダイナミックレンジおよび広色域シーケンスの再形成および符号化のためのシステム | |
KR102380164B1 (ko) | 게이밍 및/또는 sdr+ 콘텐츠에 대한 자동 디스플레이 관리 메타데이터 생성 | |
TWI575933B (zh) | 階層式視覺動態範圍編碼中之層分解技術 | |
JP6846442B2 (ja) | ハイダイナミックレンジ画像のためのクロマ再構成 | |
US10609424B2 (en) | Single-layer progressive coding for supporting multi-capability HDR composition | |
CN105052143A (zh) | 对多层vdr译码中的感知量化的视频内容进行编码 | |
JP7443546B2 (ja) | 画像処理方法、システム及びコンピュータ・プログラム | |
EP3306563B1 (en) | Inverse luma/chroma mappings with histogram transfer and approximation | |
WO2020117603A1 (en) | Interpolation of reshaping functions | |
JP2020524446A (ja) | 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化 | |
CN114556940A (zh) | 视频编解码器中的质量与计算复杂度之间的可调整的折衷 | |
JP7434554B2 (ja) | カスケード予測 | |
RU2794137C1 (ru) | Предсказатель b-сплайна тензорного произведения | |
US20240095893A1 (en) | Image enhancement via global and local reshaping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220530 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7386977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |