JP7073536B2 - 復号化または符号化の方法、装置および媒体 - Google Patents
復号化または符号化の方法、装置および媒体 Download PDFInfo
- Publication number
- JP7073536B2 JP7073536B2 JP2020563843A JP2020563843A JP7073536B2 JP 7073536 B2 JP7073536 B2 JP 7073536B2 JP 2020563843 A JP2020563843 A JP 2020563843A JP 2020563843 A JP2020563843 A JP 2020563843A JP 7073536 B2 JP7073536 B2 JP 7073536B2
- Authority
- JP
- Japan
- Prior art keywords
- transform
- data block
- target data
- block
- transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 81
- 230000009466 transformation Effects 0.000 claims description 155
- 238000006243 chemical reaction Methods 0.000 claims description 95
- 238000000844 transformation Methods 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 13
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 11
- 238000012546 transfer Methods 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 50
- 230000006835 compression Effects 0.000 description 25
- 238000007906 compression Methods 0.000 description 25
- 230000033001 locomotion Effects 0.000 description 21
- 238000003860 storage Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000717 retained effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000002457 bidirectional effect Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 101150114515 CTBS gene Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 101150089388 dct-5 gene Proteins 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- UPBAOYRENQEPJO-UHFFFAOYSA-N n-[5-[[5-[(3-amino-3-iminopropyl)carbamoyl]-1-methylpyrrol-3-yl]carbamoyl]-1-methylpyrrol-3-yl]-4-formamido-1-methylpyrrole-2-carboxamide Chemical compound CN1C=C(NC=O)C=C1C(=O)NC1=CN(C)C(C(=O)NC2=CN(C)C(C(=O)NCCC(N)=N)=C2)=C1 UPBAOYRENQEPJO-UHFFFAOYSA-N 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/156—Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本願は、2018年2月5日に米国特許&商標庁に提出された米国仮出願第62/626,539号からの優先権および2018年12月28日に米国特許&商標庁に提出された米国仮出願第16/235,395号からの優先権を主張し、それらの開示の全体が参照により本明細書に組み込まれる。
本開示は、ビデオ圧縮技術に関するものである。特に、本開示は、高効率ビデオ符号化(HEVC:High Efficiency Video Coding)に勝るビデオ符号化/復号化技術を含む次世代ビデオ符号化技術に関するものである。特に、本開示は、現在のHEVC規格(現在の拡張機能を含む)の圧縮能力を著しく超える圧縮能力を有する将来のビデオ符号化技術の規格化への潜在的なニーズに関するものである。非特許文献1で論じられているように、HEVCの能力を超えるビデオ符号化技術を探索するために、共同探索モデル(JEM:Joint Exploration Model)が開発された。JEMの比較的新しいバージョンは、JEM-7.0であり、JVET-G1001のアルゴリズム説明を有する。開示された主題は、JEM 7.0のコンテキストおよびJEM-7.0の変更において使用されてもよい。より具体的には、本開示の一態様は、例えば64ポイント、128ポイント、256ポイント、さらに256ポイント以上の変換などの大規模変換のための、低複雑度変換スキームに基づいて符号化または復号化するための方法、デバイス、およびコンピュータ媒体に関するものである。
動き補償を有するフレーム間画像予測を使用するビデオ符号化および復号化が何十年も知られている。圧縮されていないデジタルビデオは、一連の画像によって形成されることができ、各画像が、例えば1920×1080の輝度サンプルおよび関連された色度サンプルの空間的次元を有する。この一連の画像は、例えば1秒間に60枚の画像または60ヘルツ(Hz)の固定または可変の画像レート(非公式にはフレームレートとして知られている)を有することができる。圧縮されていないビデオには、非常に高いビットレート要件がある。例えば、サンプル毎の8ビットの1080p60 4:2:0のビデオ(60Hzのフレームレートでの1920x1080の輝度サンプル解像度)は、1.5Gbit/sの帯域幅に近い必要がある。このようなビデオは、一時間で600GB以上の記憶空間を必要とする。
非特許文献1とは、ITU-T SG16 WP3とISO/IEC JTC1/SC29/WG11の共同ビデオ探索チームが、2017年7月13日~21日に、イタリア・トリノで開催された第7回の会議で、JVET-G100を提案し、作者が「J.Chen、E.Alshina、G.J.Sullivan、J.-R.OhmとJ.Boyce」であり、名称が「Algorithm Description of Joint Exploration Test Model 7 (JEM 7)、共同探索テストモデル7(JEM 7)のアルゴリズム記述」である。
CTUサイズは、四分木のルートノードのサイズであり、HEVCにおける同じ概念である。
MinQTSizeは、許可された最小の四分木のリーフノードのサイズである。
MaxBTSizeは、許可された最大の二分木のルートノードのサイズである。
MaxBTDepthは、許可された最大の二分木の深さである。
MinBTSizeは、許可された最小の二分木のリーフノードのサイズである。
Claims (12)
- 少なくとも1つのメモリと、少なくとも1つのプロセッサとを含む装置によって実行される方法であって、
前記少なくとも1つのプロセッサが、音声、ビデオまたは画像のデータブロックに関する情報を受信するステップであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックであるステップと、
前記少なくとも1つのプロセッサが、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定するステップと、
前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記少なくとも1つのプロセッサが、前記ターゲットデータブロックの符号化または復号化を実行するが、大規模変換を適用する代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用し、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用するステップであって、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、
ステップと、
を含み、
前記低複雑度変換はスケーリングすることにより、前記低複雑度変換のサイズとは異なる別の変換サイズの同じ量子化スキームを再利用し、前記低複雑度変換のNポイント変換コアが、K*K’が単位行列となる直交変換コアKを使用して64*sqrt(N)でスケーリングされる、
ことを特徴とする方法。 - 前記少なくとも1つのプロセッサは、より低周波数の変換係数のみを維持するように、高周波数変換係数をゼロ設定するステップ、
をさらに含むことを特徴とする請求項1に記載の方法。 - 少なくとも1つのメモリと、少なくとも1つのプロセッサとを含む装置によって実行される方法であって、
前記少なくとも1つのプロセッサが、音声、ビデオまたは画像のデータブロックに関する情報を受信するステップであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックであるステップと、
前記少なくとも1つのプロセッサが、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定するステップと、
前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記少なくとも1つのプロセッサが、前記ターゲットデータブロックの符号化または復号化を実行するが、大規模変換を適用する代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用し、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用するステップであって、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、
ステップと、
を含み、
前記方法は、
前記少なくとも1つのプロセッサが、前記低複雑度変換をスケーリングすることにより量子化スキームを生成するステップと、
前記低複雑度変換が前記アダマール変換ではない場合、前記少なくとも1つのプロセッサが、生成された量子化スキームを使用して前記ターゲットデータブロックを符号化または復号化するようにする情報を生成または転送するステップと、
前記低複雑度変換が前記アダマール変換である場合、前記少なくとも1つのプロセッサが、(i)大規模変換でのスケーリングの差を補償するためにシフトを実行することによって前記量子化スキームを調整し、(ii)調整された量子化スキームを使用して前記ターゲットデータブロックを符号化または復号化するようにする情報を生成または転送するステップであって、ここで、前記復号化は、前記ターゲットデータブロックを逆変換して逆量子化された変換ブロックを導出することを含み、符号化においてサブサンプリングが適用されていた場合には残差ブロックを元のブロックサイズにアップサンプリングすることをさらに含む、ステップ、
をさらに含むことを特徴とする方法。 - 前記ブロックサイズの幅および高さのうちの少なくとも1つが128に等しいターゲットデータブロックに対して、128ポイント変換について、前記少なくとも1つのプロセッサは、最初の64、32、16、8、4、2または1つの変換係数のみを使用し、残りの係数をゼロ設定する、
ことを特徴とする請求項1ないし3のうちいずれか一項に記載の方法。 - 少なくとも1つのメモリと、少なくとも1つのプロセッサとを含む装置によって実行される方法であって、
前記少なくとも1つのプロセッサが、音声、ビデオまたは画像のデータブロックに関する情報を受信するステップであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックであるステップと、
前記少なくとも1つのプロセッサが、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定するステップと、
前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記少なくとも1つのプロセッサが、前記ターゲットデータブロックの符号化または復号化を実行するが、大規模変換を適用する代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用し、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用するステップであって、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、
ステップと、
を含み、
前記少なくとも1つのプロセッサは、大規模変換を水平および/または垂直方向に適用する必要がある場合、MxNの大規模変換を適用する代わりに、複数のより小さいブロックサイズの変換を水平および/または垂直方向に適用し、各々のより小さいブロックサイズの変換に対してゼロ化を適用して、該ゼロ化の結果を重み付けて加算することで、ブロック全体の変換係数を生成し、逆の大規模変換を前記水平および/または垂直方向に適用する必要がある場合、MxNの逆の大規模変換を適用する代わりに、より小さいブロックサイズの変換を適用して、MxNにアップサンプリングすることで、ブロック全体の残差を生成し、ここで、Mはブロックの幅であり、Nはブロックの高さである、
ことを特徴とする方法。 - 装置であって、
コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、
前記少なくとも1つのメモリにアクセスして、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサと、を含み、前記コンピュータプログラムコードは、
前記少なくとも1つのプロセッサに、音声、ビデオまたは画像のデータブロックに関する情報を受信させる、ように構成される第1適用コードであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックである、第1適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定させる、ように構成される第2適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記ターゲットデータブロックの符号化または復号化を実行させるが、大規模変換を適用させる代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用させ、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用させ、ここで、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、ように構成される第3適用コードと、を含み、
前記少なくとも1つのプロセッサに、前記低複雑度変換をスケーリングすることにより前記低複雑度変換のサイズとは異なる別の変換サイズの同じ量子化スキームを再利用させ、ここで、前記低複雑度変換のNポイント変換コアが、K*K’が単位行列となる直交変換コアKを使用して64×sqrt(N)でスケーリングされる、ように構成される第5適用コードをさらに含む、単位行列である、
ことを特徴とする装置。 - 前記少なくとも1つのプロセッサに、より低周波数の変換係数のみが維持されるように、高周波数変換係数をゼロ設定させる、ように構成される第4適用コードをさらに含む、
ことを特徴とする請求項6に記載の装置。 - 装置であって、
コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、
前記少なくとも1つのメモリにアクセスして、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサと、を含み、前記コンピュータプログラムコードは、
前記少なくとも1つのプロセッサに、音声、ビデオまたは画像のデータブロックに関する情報を受信させる、ように構成される第1適用コードであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックである、第1適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定させる、ように構成される第2適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記ターゲットデータブロックの符号化または復号化を実行させるが、大規模変換を適用させる代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用させ、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用させ、ここで、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、ように構成される第3適用コードと、を含み、
前記少なくとも1つのプロセッサに、
前記低複雑度変換をスケーリングすることにより量子化スキームを生成させ、
前記低複雑度変換が前記アダマール変換ではない場合、生成された量子化スキームを使用して、前記ターゲットデータブロックを符号化または復号化するようにする情報を生成または転送させ、
前記低複雑度変換が前記アダマール変換である場合、(i)大規模変換でのスケーリングの差を補償するためにシフトを実行することによって前記量子化スキームを調整させ、(ii)調整された量子化スキームを使用して前記ターゲットデータブロックを符号化または復号化するようにする情報を生成または転送させ、ここで、前記復号化は、前記ターゲットデータブロックを逆変換して逆量子化された変換ブロックを導出することを含み、符号化においてサブサンプリングが適用されていた場合には残差ブロックを元のブロックサイズにアップサンプリングすることをさらに含む、ように構成される第5適用コードをさらに含む、
ことを特徴とする装置。 - 前記ブロックサイズの幅および高さのうちの少なくとも1つが128に等しいターゲットデータブロックに対して、128ポイント変換について、最初の64、32、16、8、4、2または1つの変換係数のみを使用し、残りの係数をゼロ設定する、
ことを特徴とする請求項6ないし8のうちいずれか一項に記載の装置。 - 装置であって、
コンピュータプログラムコードを記憶するように構成される少なくとも1つのメモリと、
前記少なくとも1つのメモリにアクセスして、前記コンピュータプログラムコードに従って動作するように構成される少なくとも1つのプロセッサと、を含み、前記コンピュータプログラムコードは、
前記少なくとも1つのプロセッサに、音声、ビデオまたは画像のデータブロックに関する情報を受信させる、ように構成される第1適用コードであって、前記データブロックは、符号化または復号化するためのターゲットデータブロックである、第1適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定させる、ように構成される第2適用コードと、
前記少なくとも1つのプロセッサに、前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記ターゲットデータブロックの符号化または復号化を実行させるが、大規模変換を適用させる代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用させ、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用させ、ここで、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つである、ように構成される第3適用コードと、を含み、
大規模変換を水平および/または垂直方向に適用する必要がある場合、MxNの大規模変換を適用する代わりに、複数のより小さいブロックサイズの変換を水平および/または垂直方向に適用し、各々のより小さいブロックサイズの変換に対してゼロ化を適用して、該ゼロ化の結果を重み付けて加算することで、ブロック全体の変換係数を生成し、逆の大規模変換を前記水平および/または垂直方向に適用する必要がある場合、MxNの逆の大規模変換を適用する代わりに、より小さいブロックサイズの変換を適用して、MxNにアップサンプリングすることで、ブロック全体の残差を生成し、ここで、Mはブロックの幅であり、Nはブロックの高さである、
ことを特徴とする装置。 - 1つ以上のプロセッサに、
音声、ビデオまたは画像のデータブロックに関する情報を受信するステップであって、符前記データブロックは、符号化または復号化するためのターゲットデータブロックである、ステップと、
前記ターゲットデータブロックのブロックサイズの幅または高さのうちの少なくとも1つが所定の閾値以上であるかどうかを決定するステップと、
前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つが所定の閾値以上である場合、前記ターゲットデータブロックの符号化または復号化を実行するが、大規模変換を適用する代わりに、前記ターゲットデータブロックの第1部分に第1変換を適用し、前記ターゲットデータブロックの前記第1部分とは異なる第2部分に前記第1変換または前記第1変換とは異なる第2変換を適用するステップであって、前記第1変換と前記第2変換のうちの少なくとも1つが、前記所定の閾値より小さいサイズを有する低複雑度変換であり、大規模変換とは前記ターゲットデータブロックのブロックサイズの幅または高さのうちの前記少なくとも1つに対応するサイズを有する変換であり、前記低複雑度変換は、変換コアが1と-1のみからなるアダマール変換(Hadamard transform)と、前記変換コアが2の累乗のみからなる所定の変換とのうちの1つであり、
前記低複雑度変換はスケーリングすることにより、前記低複雑度変換のサイズとは異なる別の変換サイズの同じ量子化スキームを再利用し、前記低複雑度変換のNポイント変換コアが、K*K’が単位行列となる直交変換コアKを使用して64*sqrt(N)でスケーリングされる、ステップとを実行させるための
コンピュータ・プログラム。 - 請求項1~5のいずれか1項に記載の方法を、少なくとも1つのメモリと、少なくとも1つのプロセッサとを含む装置に実行させる、
ことを特徴とするコンピュータ・プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862626539P | 2018-02-05 | 2018-02-05 | |
US62/626,539 | 2018-02-05 | ||
US16/235,395 | 2018-12-28 | ||
US16/235,395 US10812797B2 (en) | 2018-02-05 | 2018-12-28 | Method, apparatus and medium for decoding or encoding using a low-complexity transform |
PCT/IB2019/051334 WO2019150349A1 (en) | 2018-02-05 | 2019-02-19 | Method, apparatus and medium for decoding or encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021513302A JP2021513302A (ja) | 2021-05-20 |
JP7073536B2 true JP7073536B2 (ja) | 2022-05-23 |
Family
ID=67475829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020563843A Active JP7073536B2 (ja) | 2018-02-05 | 2019-02-19 | 復号化または符号化の方法、装置および媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10812797B2 (ja) |
EP (1) | EP3750318A4 (ja) |
JP (1) | JP7073536B2 (ja) |
KR (1) | KR102472689B1 (ja) |
CN (1) | CN111630864B (ja) |
WO (1) | WO2019150349A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113411578B (zh) | 2016-05-13 | 2024-04-12 | 夏普株式会社 | 图像解码装置及其方法、图像编码装置及其方法 |
WO2019188466A1 (ja) * | 2018-03-30 | 2019-10-03 | ソニー株式会社 | 画像処理装置および方法 |
KR102432406B1 (ko) * | 2018-09-05 | 2022-08-12 | 엘지전자 주식회사 | 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치 |
US11418793B2 (en) * | 2018-10-04 | 2022-08-16 | Qualcomm Incorporated | Adaptive affine motion vector coding |
US11128866B2 (en) | 2018-10-18 | 2021-09-21 | Qualcomm Incorporated | Scans and last coefficient position coding for zero-out transforms |
US12095993B2 (en) * | 2019-03-10 | 2024-09-17 | Hfi Innovation Inc. | Method and apparatus of the quantization matrix computation and representation for video coding |
CN113597770B (zh) * | 2019-03-12 | 2023-10-27 | Lg 电子株式会社 | 基于变换的图像编译方法及其装置 |
EP4459992A1 (en) * | 2019-03-15 | 2024-11-06 | Samsung Electronics Co., Ltd. | Image encoding method and device, and image decoding method and device |
CN113892265A (zh) * | 2019-05-30 | 2022-01-04 | 夏普株式会社 | 图像解码装置 |
MX2022001645A (es) * | 2019-08-08 | 2022-04-06 | Lg Electronics Inc | Metodo de codificacion de video con base en transformacion, y dispositivo para el mismo. |
CN114342398A (zh) * | 2019-08-20 | 2022-04-12 | 北京字节跳动网络技术有限公司 | 默认缩放矩阵和用户定义缩放矩阵的使用 |
US20210084303A1 (en) * | 2019-09-12 | 2021-03-18 | Alibaba Group Holding Limited | Method and apparatus for coding video data in transform-skip mode |
US11206395B2 (en) * | 2019-09-24 | 2021-12-21 | Mediatek Inc. | Signaling quantization matrix |
CN115190306A (zh) * | 2021-04-01 | 2022-10-14 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
CN113286150B (zh) * | 2021-05-17 | 2023-03-24 | 北京大学深圳研究生院 | 用于视频编解码的变换编码硬件实现方法、装置及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120082211A1 (en) | 2010-09-30 | 2012-04-05 | Madhukar Budagavi | Low Complexity Large Transform |
US20140010284A1 (en) | 2011-02-25 | 2014-01-09 | Samsung Electronics Co., Ltd. | Image transform and inverse transform method, and image encoding and decoding device using same |
WO2017039501A1 (en) | 2015-09-01 | 2017-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Spatial improvement of transform blocks |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5128756A (en) * | 1990-12-11 | 1992-07-07 | At&T Bell Laboratories | High definition television coding arrangement with graceful degradation |
US9191260B1 (en) * | 1999-04-05 | 2015-11-17 | Lightworks Ii, Llc | Method and apparatus to determine a match between signals |
US6980596B2 (en) * | 2001-11-27 | 2005-12-27 | General Instrument Corporation | Macroblock level adaptive frame/field coding for digital video content |
US7231090B2 (en) * | 2002-10-29 | 2007-06-12 | Winbond Electronics Corp. | Method for performing motion estimation with Walsh-Hadamard transform (WHT) |
US7379500B2 (en) * | 2003-09-30 | 2008-05-27 | Microsoft Corporation | Low-complexity 2-power transform for image/video compression |
US8155195B2 (en) * | 2006-04-07 | 2012-04-10 | Microsoft Corporation | Switching distortion metrics during motion estimation |
KR101498044B1 (ko) * | 2007-01-10 | 2015-03-05 | 삼성전자주식회사 | 매크로 블럭이 적응적으로 부호화된 압축영상에 대한축소영상 생성방법 및 이를 적용한 영상기기 |
US9288089B2 (en) * | 2010-04-30 | 2016-03-15 | Ecole Polytechnique Federale De Lausanne (Epfl) | Orthogonal differential vector signaling |
US9788019B2 (en) | 2011-03-09 | 2017-10-10 | Hfi Innovation Inc. | Method and apparatus of transform unit partition with reduced complexity |
US20130003856A1 (en) * | 2011-07-01 | 2013-01-03 | Samsung Electronics Co. Ltd. | Mode-dependent transforms for residual coding with low latency |
EP2745519B1 (en) | 2011-08-17 | 2017-09-27 | MediaTek Singapore Pte Ltd. | Method and apparatus for intra prediction using non-square blocks |
KR102061201B1 (ko) * | 2012-04-12 | 2019-12-31 | 주식회사 골드피크이노베이션즈 | 블록 정보에 따른 변환 방법 및 이러한 방법을 사용하는 장치 |
AU2012232992A1 (en) * | 2012-09-28 | 2014-04-17 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding the transform units of a coding unit |
US20160050440A1 (en) * | 2014-08-15 | 2016-02-18 | Ying Liu | Low-complexity depth map encoder with quad-tree partitioned compressed sensing |
US10306229B2 (en) * | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
US20170150176A1 (en) * | 2015-11-25 | 2017-05-25 | Qualcomm Incorporated | Linear-model prediction with non-square prediction units in video coding |
MX2021012481A (es) * | 2016-03-16 | 2022-05-30 | Hfi Innovation Inc | Metodo y aparato de procesamiento de datos de video con tama?o restringido de bloque en codificacion de video. |
US10972733B2 (en) * | 2016-07-15 | 2021-04-06 | Qualcomm Incorporated | Look-up table for enhanced multiple transform |
US10666937B2 (en) * | 2016-12-21 | 2020-05-26 | Qualcomm Incorporated | Low-complexity sign prediction for video coding |
JP6906324B2 (ja) * | 2017-02-20 | 2021-07-21 | キヤノン株式会社 | 符号化装置、符号化方法、及び、プログラム |
US10779007B2 (en) * | 2017-03-23 | 2020-09-15 | Mediatek Inc. | Transform coding of video data |
US10659781B2 (en) * | 2018-04-02 | 2020-05-19 | Tencent America LLC | Concatenated coding units in flexible tree structure |
US10536720B2 (en) * | 2018-05-07 | 2020-01-14 | Tencent America LLC | Method, apparatus and medium for decoding or encoding |
-
2018
- 2018-12-28 US US16/235,395 patent/US10812797B2/en active Active
-
2019
- 2019-02-19 WO PCT/IB2019/051334 patent/WO2019150349A1/en unknown
- 2019-02-19 CN CN201980001908.5A patent/CN111630864B/zh active Active
- 2019-02-19 EP EP19747110.5A patent/EP3750318A4/en active Pending
- 2019-02-19 JP JP2020563843A patent/JP7073536B2/ja active Active
- 2019-02-19 KR KR1020207025369A patent/KR102472689B1/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120082211A1 (en) | 2010-09-30 | 2012-04-05 | Madhukar Budagavi | Low Complexity Large Transform |
US20140010284A1 (en) | 2011-02-25 | 2014-01-09 | Samsung Electronics Co., Ltd. | Image transform and inverse transform method, and image encoding and decoding device using same |
WO2017039501A1 (en) | 2015-09-01 | 2017-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Spatial improvement of transform blocks |
Non-Patent Citations (2)
Title |
---|
Jianle Chen, et al.,Algorithm Description of Joint Exploration Test Model 7 (JEM 7),Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-G1001-v1,7th Meeting: Torino, IT,2017年08月,pp.28-30 |
Xiang Li, et al.,Description of SDR video coding technology proposal by Tencent,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-J0029-v1,10th Meeting: San Diego, US,2018年04月,pp.5-6 |
Also Published As
Publication number | Publication date |
---|---|
EP3750318A4 (en) | 2021-03-31 |
KR20200134218A (ko) | 2020-12-01 |
JP2021513302A (ja) | 2021-05-20 |
US20190246142A1 (en) | 2019-08-08 |
EP3750318A1 (en) | 2020-12-16 |
CN111630864B (zh) | 2024-01-30 |
KR102472689B1 (ko) | 2022-11-30 |
CN111630864A (zh) | 2020-09-04 |
WO2019150349A1 (en) | 2019-08-08 |
US10812797B2 (en) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7073536B2 (ja) | 復号化または符号化の方法、装置および媒体 | |
JP7062788B2 (ja) | ビデオを復号する方法、装置およびコンピュータプログラム | |
JP7053947B2 (ja) | ビデオシーケンスを復号する方法、装置及びコンピュータプログラム | |
JP7213264B2 (ja) | デコードまたはエンコードのための方法並びに装置およびコンピュータプログラム | |
JP7295210B2 (ja) | 高速dst-7 | |
JP2022105007A (ja) | ビデオ圧縮における複数ラインのフレーム内予測のための方法および装置 | |
JP2022515876A (ja) | ビデオデコーディングのための方法、装置、媒体、およびプログラム | |
JP2021517395A (ja) | ビデオ復号方法、装置およびコンピュータプログラム | |
JP7048755B2 (ja) | 柔軟なツリー構造 | |
CN110881127A (zh) | 控制残差编码的方法、装置、计算机设备和存储介质 | |
JP2022507314A (ja) | 単一レベルの変換分割および適応サブブロック変換を行うための方法、装置、およびプログラム | |
JP2022515029A (ja) | ビデオ復号及び符号化の方法、装置並びにコンピュータプログラム | |
JP7500732B2 (ja) | コンテキスト適応変換セット | |
JP2022515799A (ja) | ビデオ復号の方法および装置、並びにプログラム | |
CN110784724A (zh) | 控制用于解码或编码视频序列的残差编码的方法和装置 | |
CN113316932B (zh) | 编解码方法、装置和设备 | |
CN111757122A (zh) | 视频解码方法和装置、计算机设备和存储介质 | |
CN113545055A (zh) | 视频编解码的方法和装置 | |
CN114365499A (zh) | 使用l型划分树的帧内编码 | |
CN118541733A (zh) | 位置压缩中的网格顶点分组 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7073536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |